Depuis plus d’un an, le débat sur l’infrastructure dédiée à l’Intelligence Artificielle (IA) tourne quasi exclusivement autour d’un acteur clé : les GPU. Cependant, le marché commence à révéler une autre facette de cette même crise. Les CPU serveur — la colonne vertébrale du “computing traditionnel” supportant la virtualisation, les réseaux, le stockage, les bases de données et le fonctionnement quotidien de tout centre de données — deviennent également une ressource rare. Et en Chine, cette tension se traduit déjà par des délais de livraison exceptionnellement longs et officiellement signalés.
Selon des informations publiées cette semaine, Intel a informé certains clients en Chine que la disponibilité de certaines CPU Xeon de 4e et 5e génération pourrait entraîner des attentes de livraison pouvant atteindre jusqu’à six mois. De son côté, AMD a indiqué des délais de retard compris entre 8 et 10 semaines pour certains modèles EPYC. Dans un marché habitué à planifier ses déploiements par trimestres, de tels calendriers disruptent les budgets, modifient les contrats et forcent à redéfinir les stratégies d’achat avec beaucoup moins de marges de manœuvre.
Pourquoi l’IA « consomme » aussi des CPU
Une explication simple : l’IA ne s’appuie pas uniquement sur des accélérateurs. Un cluster IA moderne nécessite tout un écosystème : serveurs pour l’orchestration, stockage, services de données, sécurité, virtualisation, surveillance et interfaces utilisateur alimentant les pipelines. À mesure que les entreprises passent du pilote à la production, la facture en « calcul général » augmente parallèlement au nombre de GPU.
De plus, un phénomène récent amplifie cette tendance : l’émergence de systèmes d’IA agissante (capables d’enchaîner des tâches, d’utiliser des outils et d’exécuter des flux complexes surpassant la simple interaction d’un chatbot) stimule la demande en ressources serveur. Sans appartenir directement aux accélérateurs, ces ressources restent indispensables pour traiter efficacement les tâches en environnement professionnel.
Une pression directe sur les prix, la planification et le pouvoir de négociation
Le résultat est quasi automatique : lorsque l’offre se raréfie, les prix deviennent volatils et ne se comportent plus comme une variable stable. En Chine, certains processeurs soumis à des ruptures de stock ont déjà enregistré des hausses de prix supérieures à 10 %, une évolution significative dans des achats en volume où chaque point de pourcentage compte.
Intel pratique également la rationalisation des livraisons de certains modèles afin de gérer l’accumulation des commandes en attente — une stratégie courante lorsque le fabricant souhaite préserver ses relations stratégiques ou répartir la pénurie, plutôt que de risquer un blocage complet. De leur côté, AMD, bien que confronté à des délais plus courts, indique également une tension croissante : si la demande en CPU serveur dépasse largement les prévisions, la réelle flexibilité de la chaîne d’approvisionnement s’évalue désormais en semaines… voire en mois.
Fabrication sous contrainte : performances, capacités et priorités
Plusieurs facteurs expliquent ces retards. Chez Intel, on évoque principalement des limitations de fabrication et de rendement (le pourcentage de chips valides par wafer). Pour AMD, la dépendance aux fondeurs externes complexifie la donne : la capacité globale de production et d’emballage se redéfinit autour de produits liés à l’IA, avec une compétition acharnée pour les mêmes ressources industrielles.
Par ailleurs, le marché voit augmenter le coût des composants critiques, notamment la mémoire. Cette pression ne se limite pas au prix final, mais affecte aussi la manière dont les accords sont conclus : certains grands fabricants de mémoire ont commencé à proposer des contrats plus courts et des formules de “post-liquidation”, permettant d’ajuster le prix ultérieurement en fonction du marché. C’est un signal clair que le cycle actuel pousse les fournisseurs à éviter de s’enliser dans des prix fixes si la pénurie se prolonge.
En conséquence, les services achats sont poussés à revoir leurs stratégies classiques (contrats longue durée, remises en volume) pour privilégier davantage la flexibilité sur les références (SKU), la capacité à accepter des alternatives et la planification anticipée.
Chine : un thermomètre sensible pour Intel… et un test pour tous
Ce focus sur la Chine n’est pas anodin. Pour Intel, le pays représente un marché crucial et un point de convergence pour l’investissement dans les centres de données, la nécessité de faire évoluer rapidement l’IA et une dynamique d’approvisionnement de plus en plus surveillée. Les clients concernés incluent aussi bien de grands fabricants de serveurs que des acteurs majeurs du cloud.
Dans ce contexte, ce qui est fondamental : le marché des CPU serveur était déjà en pleine transition. Intel a perdu des parts au profit d’AMD ces dernières années, tandis que la demande totale continue d’augmenter. En somme : ce n’est pas simplement une question de « volume de vente » mais d’une croissance globale où toute déviation de capacité devient un goulet d’étranglement immédiat.
Que prévoir en 2026 : du “just in time” au “just in case”
Le secteur des centres de données a passé des années à affiner ses chaînes d’approvisionnement pour fonctionner avec des stocks resserrés. Cependant, la montée en puissance de l’IA pousse à une autre logique : acheter en avance, sécuriser ses quotas, accepter des contrats plus contraints, voire repenser certains déploiements.
À court terme, la conséquence la plus probable est que les projets d’infrastructure en Chine — et par extension dans d’autres régions — devront recalculer leurs calendriers. Il ne s’agit pas d’un manque d’équipements ou d’énergie, mais du composant le plus fondamental : la CPU. À moyen terme, le marché pourrait évoluer vers des accords plus flexibles, voire plus coûteux, avec des contrats à durée plus courte, davantage de négociations et une volatilité accrue des prix — un peu comme ce qui se constate déjà dans le domaine de la mémoire.
Dans un secteur où “le temps, c’est de l’argent” — et où chaque retard dans la capacité installée peut représenter une perte d’opportunités — 2026 semble devenir l’année où l’infrastructure IA ne se limitera plus aux GPU, mais s’appréciera comme la somme de toutes ses composantes essentielles.
Questions fréquentes
Que signifie qu’une CPU serveur ait un “délai de livraison” pouvant aller jusqu’à 6 mois ?
Que, dès la confirmation de la commande, le fabricant ou le canal de distribution peut prendre jusqu’à un demi-année pour fournir une unité spécifique. Dans le contexte des projets de centres de données, cela oblige à réserver la capacité et à planifier les déploiements bien en avance.
Pourquoi l’infrastructure IA nécessite-t-elle autant de CPU alors que l’on met surtout l’accent sur les GPU ?
Parce que si les GPU accélèrent l’entraînement et l’inférence, le système complet requiert des CPU pour orchestrer, déplacer les données, virtualiser les services, gérer le stockage et exécuter des tâches auxiliaires permettant le bon fonctionnement du cluster.
Quel est l’impact de la hausse des prix de la mémoire sur la disponibilité des CPU serveur ?
La mémoire étant un composant clé, une augmentation de son coût ou une pénurie incitent de nombreux clients à accélérer leurs achats pour assurer leur approvisionnement, ce qui peut entraîner des commandes massive d’équipements complets (CPU + mémoire + carte mère + réseau) et mettre sous tension les stocks.
Comment les entreprises et les administrateurs systèmes peuvent-ils se préparer face à des retards sur les Xeon ou EPYC ?
En élargissant leurs fenêtres d’achat, en homologuant des alternatives (différentes gammes ou configurations), en concevant des architectures plus flexibles et en évitant de dépendre d’un seul SKU critique pour tout le déploiement.