Les GPU pour datacenters ne sont plus une composante spécialisée, mais l’un des éléments les plus convoités de l’infrastructure numérique. L’intelligence artificielle générative, l’entraînement de modèles, l’inférence à grande échelle, l’analyse avancée, la simulation scientifique et les services cloud stimulent une demande qui ne concerne plus seulement les fabricants de puces. Elle implique aussi les fournisseurs cloud, les intégrateurs de serveurs, les fabricants de réseaux, les entreprises de refroidissement, les exploitants de centres de données et les sociétés d’électricité.
L’infographie accompagnant ce rapport résume bien cette évolution : NVIDIA domine les discussions, mais le marché ne peut plus simplement être considéré comme une course entre fabricants de cartes. AMD, Intel, Huawei, Cerebras, SambaNova et d’autres concurrents se positionnent dans différentes couches ; les hyperscalaires achètent massivement de la capacité ; les OEM comme Dell, HPE, Lenovo, Supermicro, QCT, Gigabyte ou ASUS assemblent ces accélérateurs dans des serveurs ; et le logiciel, de CUDA à ROCm, oneAPI, OpenShift AI, SUSE ou Ubuntu, détermine en grande partie l’expérience utilisateur réelle.
Les projections de marché varient énormément selon les cabinets de conseil, ce qui est logique dans un secteur en croissance si rapide que de nombreux modèles statistiques peinent à le suivre. Market.us estime que le marché mondial des GPU pour datacenters pourrait passer d’environ 18 milliards de dollars en 2024 à 183 milliards en 2034. Precedence Research le chiffre à 21,77 milliards en 2025, avec une projection de 226,87 milliards en 2035. Future Market Insights parle de 21,6 milliards en 2025 et 265,5 milliards en 2035, tandis que SNS Insider monte la prévision à 284,8 milliards en 2035. Les chiffres diffèrent, mais la tendance est claire : de 2025 à 2035, la croissance sera forte pour le calcul accéléré.
NVIDIA en tête, mais la concurrence évolue en couches
NVIDIA reste l’acteur principal. Ses résultats financiers illustrent à quel point l’IA a révolutionné son activité : au premier trimestre de son exercice fiscal 2027, la société a déclaré un chiffre d’affaires record de 81,6 milliards de dollars, dont 75,2 milliards provenant du segment des centres de données, soit une augmentation de 92 % par rapport à l’année précédente. Ce chiffre explique pourquoi parler de GPU pour centres de données, c’est aussi parler de pouvoir de marché, de disponibilité des puces, de goulets d’étranglement et de concentration des fournisseurs.
Mais le marché ne se limite pas à NVIDIA. AMD renforce sa gamme Instinct avec des accélérateurs comme la série MI350, dédiée à l’IA générative, HPC, l’entraînement, l’inférence et les charges scientifiques. Intel maintient sa stratégie autour des accélérateurs et de l’écosystème oneAPI, même si avec une position plus complexe. Huawei pousse Ascend sur le marché chinois et dans des contextes où les restrictions américaines ont accéléré la recherche d’alternatives locales. Cerebras et SambaNova proposent des architectures plus spécifiques, conçues pour des charges d’IA pouvant bénéficier d’approches différentes des GPU traditionnels.
| Couche du marché | Acteurs principaux | Pourquoi c’est important |
|---|---|---|
| GPU et accélérateurs | NVIDIA, AMD, Intel, Huawei, Cerebras, SambaNova | Définissent la performance, la disponibilité, le coût et l’efficacité |
| Cloud et hyperscalaires | Microsoft Azure, AWS, Google Cloud, Meta, Oracle, Alibaba, Tencent | Achètent de la capacité en masse et influencent la demande mondiale |
| Serveurs et intégration | Dell, HPE, Lenovo, Supermicro, QCT, Gigabyte, ASUS | Transforment les puces en systèmes déployables dans les datacenters |
| Logiciels et plateformes | CUDA, ROCm, oneAPI, OpenShift AI, VMware, SUSE, Ubuntu | Définissent la facilité d’utilisation, la portabilité et l’adoption |
| Infrastructure physique | Réseaux, alimentation, refroidissement, racks, stockage | Décident si le cluster peut fonctionner à grande échelle |
L’essentiel, c’est que la GPU seule ne suffit pas. Un cluster d’IA requiert de la mémoire HBM, une interconnexion ultra-rapide, des commutateurs, un stockage performant, un refroidissement liquide ou hybride, des logiciels d’orchestration, des pilotes stables et des équipements capables de gérer tout cela. Le marché devient donc une chaîne de valeur complète, et plus simplement un achat de cartes.
La demande provient de l’entraînement, de l’inférence et de l’edge
La première vague de demande provenait de l’entraînement de grands modèles. Entraîner un modèle de base nécessite des milliers, voire des dizaines de milliers d’accélérateurs fonctionnant en coordination, avec d’énormes besoins en bande passante, mémoire et stabilité. Cette étape reste critique, mais la vraie pression vient désormais de l’inférence.
Une fois déployés en production, chaque requête, agent, recommandation, recherche générative ou assistant d’entreprise consomme des ressources de calcul. L’inférence peut être moins spectaculaire que l’entraînement, mais elle peut devenir une charge permanente et massive. Si des millions d’utilisateurs et d’entreprises intègrent l’IA dans leur quotidien, la demande en GPU sera continue, pas ponctuelle.
L’edge s’intensifie aussi. Tous les données ne peuvent pas voyager vers un cloud distant. Industrie, santé, retail, télécommunications, villes intelligentes, automobile ou surveillance des infrastructures nécessitent de plus en plus de traitement proche des sources de données. Des GPU et des accélérateurs pour datacenters d’edge apparaissent, moins grands que ceux de l’entraînement, mais conçus pour une faible latence, une efficacité énergétique optimale et une opération distribuée.
| Type de GPU pour datacenters | Usage principal | Exemples de charges |
|---|---|---|
| IA et machine learning | Entraînement et inférence | Grandes modèles, vision artificielle, moteurs de recommandations |
| HPC et calcul scientifique | Simulation et calcul intensif | Climat, physique, ingénierie, bioinformatique |
| Inférence | Réponse en temps réel | Chatbots, agents, recherche, personnalisation | Virtualisation | Postes virtuels et rendu | VDI, CAD, conception, stations distantes |
| Edge datacenter | Traitement local | IoT, analyse industrielle, faible latence |
Le goulet d’étranglement n’est plus uniquement le chip
La croissance du marché entraîne aussi des défis. Le premier est le coût. Un rack d’IA haute densité nécessite un investissement considérable en serveurs, accélérateurs, réseaux, stockage, énergie, refroidissement et maintenance. Pour beaucoup d’entreprises, la solution sera probablement de recourir au cloud ou à des fournisseurs spécialisés. Pour d’autres, pour des raisons de données, de latence, de sécurité ou de coût à long terme, il sera pertinent de déployer une infrastructure propre ou hybride.
Le deuxième défi, c’est l’énergie. Selon l’Agence Internationale de l’Énergie, la consommation électrique mondiale des centres de données passera de 485 TWh en 2025 à environ 950 TWh en 2030, avec une croissance encore plus rapide dans le secteur de l’IA. La disponibilité électrique, la connexion réseau et le refroidissement deviennent ainsi des éléments clés dans toute stratégie GPU pour datacenters.
Le troisième aspect est thermique. Les nouvelles générations de GPU et d’accélérateurs augmentent la densité par rack, ce qui pousse vers des solutions de refroidissement liquide, des designs plus efficaces et une planification plus précise des centres de données. Il ne suffit plus d’installer des serveurs dans une salle existante : les clusters d’IA obligent à repenser la puissance par rack, la distribution électrique, la redondance, l’évacuation de la chaleur et la maintenance.
Le quatrième enjeu concerne le logiciel. CUDA a offert à NVIDIA un avantage considérable : ce n’est pas seulement une API, c’est un écosystème complet de bibliothèques, frameworks, outils, documentation et talents. AMD travaille à renforcer ROCm, Intel pousse oneAPI, et les environnements professionnels ont besoin de couches d’orchestration et de compatibilité. À long terme, la bataille pour le logiciel sera aussi cruciale que celle pour le silicium.
L’Amérique du Nord domine, l’Asie accélère, et l’Europe cherche sa place
L’Amérique du Nord reste en tête grâce à la concentration d’hyperscalaires, les investissements, le talent et les projets d’IA. Microsoft, AWS, Google, Meta et Oracle construisent ou louent de la capacité à un rythme difficile à égaler. L’Asie-Pacifique connaît une croissance forte, notamment en Chine, au Japon, en Corée du Sud, en Inde et en Asie du Sud-Est, où la construction de centres de données et l’adoption de l’IA s’intensifient.
L’Europe occupe une position plus compliquée. Elle dispose d’une demande d’entreprises, de réglementations, d’industries avancées et de l’ambition de souveraineté numérique, mais elle souffre davantage de restrictions énergétiques, d’autorisations plus lentes, d’une moindre disponibilité de grandes régions cloud propres, et d’une dépendance accrue vis-à-vis de fournisseurs étrangers. Cependant, cette situation crée aussi des opportunités pour le cloud privé, l’infrastructure souveraine, les centres de données plus efficaces et les déploiements hybrides adaptés aux secteurs réglementés.
Le marché des GPU pour datacenters ne sera pas homogène. Les hyperscalaires continueront d’acheter en masse pour entraîner et déployer des modèles cosmopolites. Les entreprises réglementées chercheront des environnements plus contrôlés. Les fournisseurs régionaux tenteront d’offrir du GPU en mode service, privé ou bare-metal accéléré. Et les fabricants de serveurs rivaliseront pour proposer des solutions complètes afin de réduire les délais de déploiement.
La tendance de fond est claire : la GPU est devenue une infrastructure économique fondamentale. Tout comme le serveur x86 a défini une étape dans le cloud, les accélérateurs définiront la prochaine phase de l’IA. Mais le marché ne sera pas gagné par celui qui possède simplement le chip le plus performant, mais par celui qui pourra offrir un équilibre entre performance, énergie, refroidissement, logiciel, disponibilité et coût total de possession.
La décennie de l’IA ne s’appuiera pas uniquement sur des modèles. Elle se construira également avec des racks, des câbles, de la mémoire, de l’énergie, du refroidissement et des plateformes capables de transformer une capacité brute en services utiles. C’est là que se joue le véritable enjeu du marché des GPU pour datacenters.
Questions fréquentes
Qu’est-ce qu’un GPU pour centres de données ?
C’est un accélérateur conçu pour des charges intensives comme l’intelligence artificielle, le machine learning, le HPC, l’inférence, le rendu, l’analyse avancée ou la virtualisation en serveurs et clusters professionnels.
Pourquoi ce marché croît-il autant ?
En raison de l’expansion de l’IA générative, des modèles de langage, de l’inférence en production, du cloud, du HPC et du besoin de traiter de grands volumes de données avec plus d’efficacité.
NVIDIA domine-t-elle totalement le marché ?
NVIDIA mène clairement, notamment grâce à son écosystème CUDA et sa présence dans les hyperscalaires, mais AMD, Intel, Huawei et d’autres acteurs cherchent aussi à s’y faire une place dans des segments spécifiques.
Quel est le plus grand défi pour déployer des GPU en datacenters ?
Ce n’est pas seulement l’achat des puces. Les principaux obstacles sont l’énergie, le refroidissement, les réseaux, l’approvisionnement, le coût, le logiciel, le talent opérationnel et la capacité à maintenir des clusters stables à grande échelle.
via : LinkedIn