L’intelligence artificielle a été vendue pendant des mois comme un levier pour réduire les coûts, automatiser les tâches et accélérer la productivité. La réalité qui émerge dans certaines entreprises technologiques est plus dérangeante : utiliser une IA avancée peut aussi coûter très cher. Pas seulement en abonnements aux modèles, mais en tokens, en GPU, en mémoire, en centres de données et en toute l’infrastructure nécessaire pour soutenir des agents, des copilotes et des charges d’inférence à grande échelle.
La citation la plus révélatrice vient de Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez NVIDIA, interrogé par Axios : « Pour mon équipe, le coût du calcul est bien supérieur au coût des employés. » Une précision s’impose : cela ne signifie pas que chaque système IA coûte plus qu’un salarié, ni que l’automatisation soit économiquement inviable. Mais dans les équipes de pointe qui utilisent intensivement modèles, GPU et infrastructure, la facture technique commence à dépasser des postes autrefois considérés comme les plus lourds : les salaires.
L’IA n’est pas gratuite : quelqu’un paie les tokens, les GPU et l’énergie
Lors de la première phase d’adoption de l’IA générative, beaucoup d’entreprises ont surtout calculé les gains d’efficacité. Moins de temps de codage, moins d’heures en documentation, support client plus rapide, analyse de données accélérée. Mais quand l’IA passe de l’expérimental au quotidien, des coûts inattendus apparaissent.
Les tokens ont un coût. L’inférence aussi. Les agents qui effectuent plusieurs appels, consultent des dépôts, invoquent des outils, génèrent des plans et reroulent en cas d’échec consomment bien plus qu’un chatbot occasionnel. Avec un raisonnement avancé, un contexte étendu, des modèles multimodaux ou des déploiements privés, la facture grimpe encore.
Axios cite d’autres exemples : le CTO d’Uber aurait épuisé son budget IA pour 2026 en raison des coûts liés aux tokens, selon The Information. D’autres sociétés commencent à s’inquiéter face à des factures croissantes liées à l’utilisation intensive de modèles. La conclusion est là : l’IA ne remplace pas le coût du travail, elle le déplace partiellement vers l’infrastructure, les fournisseurs de modèles et la consommation de ressources informatiques.
Cela n’implique pas que l’IA ne crée pas de valeur. Elle peut en créer beaucoup. Mais cela exige une nouvelle forme de mesure. Une entreprise ne peut plus se contenter de dire que ses employés utilisent l’IA. Elle doit démontrer si cet usage réduit réellement les délais, améliore la qualité ou génère des revenus. Si la dépense en calcul augmente plus vite que la productivité, la promesse se transforme en pression financière.
Gartner : les centres de données en tête avec +55,8 % en 2026
Les données de Gartner illustrent l’ampleur du phénomène. La société de conseil prévoit que les dépenses mondiales en TI atteindront 6,31 billions de dollars en 2026, soit une hausse de 13,5 % par rapport à 2025. La catégorie qui croît le plus vite n’est ni les appareils ni les services de communication, mais les systèmes de centres de données, portés par l’infrastructure IA, la mémoire avancée et la demande en calcul haute performance.
| Catégorie | Dépenses 2025 | Croissance 2025 | Dépenses 2026 | Croissance 2026 |
|---|---|---|---|---|
| Systèmes de centres de données | 505 634 M$ | 51,6 % | 787 990 M$ | 55,8 % |
| Appareils | 791 663 M$ | 9,7 % | 856 189 M$ | 8,2 % |
| Logiciels | 1 254 449 M$ | 12,8 % | 1 443 621 M$ | 15,1 % |
| Services TI | 1 715 650 M$ | 6,2 % | 1 870 197 M$ | 9,0 % |
| Services de communication | 1 296 409 M$ | 3,3 % | 1 358 553 M$ | 4,8 % |
| Total TI | 5 563 805 M$ | 10,5 % | 6 316 550 M$ | 13,5 % |
Les chiffres parlent d’eux-mêmes. La dépense pour les systèmes de centres de données passerait de 505 milliards de dollars en 2025 à 787 milliards en 2026, soit +55,8 % en un an. Gartner attribue cette hausse à l’expansion de l’infrastructure IA, à la croissance des charges de travail et à la montée des coûts de composants comme la mémoire à haute bande passante. Une dynamique directement liée aux raisons pour lesquelles des acteurs comme Rackspace et AMD développent des offres dédiées, comme le cloud IA gouverné pour les secteurs réglementés, pour répondre à cette demande croissante.
NVIDIA en tire profit, mais en paie aussi la facture
NVIDIA est le grand bénéficiaire de cette tendance. Ses GPU, réseaux, systèmes et logiciels sont devenus le socle d’une grande partie de l’infrastructure IA moderne. La société est passée d’une réputation liée aux cartes graphiques pour le jeu à une position centrale dans les centres de données, l’entraînement de modèles, l’inférence et les agents intelligents.
Mais la déclaration de Catanzaro montre l’autre face : même le leader du matériel IA doit faire face à cette pression interne. NVIDIA vend l’infrastructure que tout le monde veut, mais l’utilise aussi intensivement dans ses propres équipes. Quand on travaille à la frontière de la technologie, la facture interne de calcul peut facilement dépasser d’autres coûts traditionnels. L’IA promet d’économiser du travail humain, mais nécessite GPU, clusters, réseaux haute vitesse, stockage, énergie, refroidissement et personnel spécialisé. Les coûts ne disparaissent pas, ils se déplacent d’une colonne du bilan vers une autre.
C’est ce qui explique que la conversation dans le monde des affaires évolue de l’adoption vers le retour sur investissement. Il ne suffit plus de compter combien d’employés utilisent l’IA. La question est combien coûte chaque processus automatisé, combien de requêtes un agent fait, quel modèle est utilisé pour chaque tâche, quelle partie peut être exécutée par des modèles plus petits et quel contexte est vraiment nécessaire.
La prochaine étape sera l’optimisation, pas l’expansion
L’enthousiasme pour l’IA ne faiblira pas. Les grandes entreprises technologiques continuent d’investir dans les centres de données, les accélérateurs, les réseaux et l’énergie. Les hyperscalers se disputent la capacité électrique, l’espace, les puces et les accords d’approvisionnement. Et on peut mesurer l’ampleur géographique de ce phénomène en observant comment l’IA pousse les centres de données vers les zones rurales, des États-Unis à l’Aragon et l’Estrémadure, à la recherche d’énergie bon marché et de terrain disponible.
Mais la période de déploiement sans contraintes touche à sa fin. Comme avec le cloud, des entreprises vont découvrir qu’une adoption rapide sans contrôle génère des factures difficiles à justifier. Dans le cloud traditionnel, des pratiques comme FinOps ont émergé pour surveiller les dépenses et éviter les ressources sous-utilisées. Dans l’IA, quelque chose de similaire sera nécessaire, mais avec des exigences spécifiques : contrôle des tokens, sélection dynamique des modèles, caches, quantification, inférence locale, limites de contexte et surveillance par cas d’usage.
L’efficacité va devenir un avantage compétitif. Les entreprises qui savent utiliser l’IA avec les bons modèles, des prompts concis et des architectures équilibrées pourront atteindre une productivité accrue sans faire exploser leurs coûts. Celles qui adoptent l’IA sans mesurer leur consommation ni leurs résultats risquent de se retrouver avec une dépense en calcul supérieure aux économies espérées. Ce n’est pas un problème d’IA. C’est un problème de gestion.
Questions fréquentes
NVIDIA a-t-elle dit que l’IA coûte plus que les employés ?
Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez NVIDIA, a déclaré à Axios que dans son équipe, le coût du calcul est bien supérieur à celui des employés. Cette déclaration ne vaut pas pour toutes les entreprises, mais illustre la réalité des équipes travaillant à la frontière de l’IA.
Pourquoi les dépenses dans les centres de données augmentent-elles autant ?
En raison de la demande croissante pour l’infrastructure IA : GPU, mémoire HBM avancée, réseaux haute performance, stockage, énergie, et capacité cloud pour entraîner et exécuter des modèles de plus en plus puissants.
Quelle sera la croissance mondiale des dépenses TI en 2026 ?
Gartner prévoit 6,31 billions de dollars, soit une hausse de 13,5 % par rapport à 2025. Les systèmes de centres de données représentent la catégorie à la croissance la plus rapide avec +55,8 %.
L’IA sera-t-elle rentable pour les entreprises ?
Cela dépend des cas d’usage et de la rigueur de la mesure. L’IA peut générer beaucoup de valeur, mais les entreprises devront surveiller précisément les coûts en tokens, calcul, licences et infrastructure pour justifier leur investissement et éviter de dépenser plus qu’elles n’économisent.
Source : WCCFTech