Pénurie de mémoire HBM : comment NVIDIA a pris l’avance

Maria Lafaye D.

X (Twitter) Facebook Pinterest LinkedIn Email

La pénurie de mémoire est devenue l’un des principaux points de tension dans l’industrie technologique. Elle ne concerne plus uniquement le prix des modules DRAM de consommation ou des serveurs traditionnels. La demande croissante en intelligence artificielle a poussé la pression jusqu’à la mémoire HBM, LPDDR et autres composants essentiels à la construction d’accélérateurs, de systèmes intégrés et de grands clusters de centres de données.

Les déclarations de Colette Kress, directrice financière de NVIDIA, ont été directes : la société estime que de nombreux concurrents ont réagi trop tard. Lors d’un entretien avec l’analyste Tae Kim, Kress a expliqué que NVIDIA anticipait déjà la hausse des prix et avait commandé de la mémoire longtemps à l’avance. Pendant que d’autres se laissaient surprendre par l’augmentation des coûts, NVIDIA l’avait prévu.

Cette remarque éclaire un avantage moins visible que la puissance des GPU : NVIDIA ne domine pas uniquement grâce à ses puces ou à un écosystème logiciel mature. Elle maîtrise aussi la gestion de sa chaîne d’approvisionnement en anticipant les besoins bien avant ses rivaux. Dans l’ère de l’IA, prévoir la disponibilité de la mémoire peut être aussi décisif que la conception même de l’accélérateur.

La mémoire devient le nouveau goulot d’étranglement

Depuis plusieurs années, le débat autour de l’IA porte surtout sur les GPU. Les modèles H100, H200, B200, Blackwell, Rubin, MI300X ou TPU sont devenus des références parmi les entreprises, investisseurs et responsables d’infrastructure. Mais chaque nouvelle génération d’accélérateurs exige d’importantes quantités de mémoire haute performance pour alimenter les modèles, gérer des fenêtres de contexte plus longues et transférer des données à grande vitesse. Cette tendance est analysée dans notre article sur le marché des GPU pour centres de données.

La mémoire HBM (High Bandwidth Memory) est devenue l’un des composants les plus convoiités du marché. Son architecture en plusieurs couches, la large bande passante qu’elle offre et sa proximité avec le processeur en font un choix idéal pour les applications IA. Mais cela la rend aussi plus complexe à fabriquer et à intégrer. Augmenter la capacité HBM implique de réorienter une partie de l’effort industriel depuis d’autres types de mémoire, avec une pression qui s’étend à la DRAM conventionnelle, LPDDR et autres segments.

Kress a souligné que NVIDIA ne se contente pas d’acheter ce qui est disponible sur le marché. La société collabore avec les fabricants de mémoire dès la phase de conception, leur indique les configurations nécessaires et planifie avec eux la capacité à venir. Selon ses propos, NVIDIA travaille avec les trois principaux fournisseurs de mémoire et non avec un seul. Cette coordination précoce lui assure l’approvisionnement, lui permet d’ajuster les volumes et d’éviter de dépendre du marché spot lorsque les prix ont déjà flambé.

Élément	Importance pour l’IA
HBM	Offre une bande passante importante pour l’entraînement et l’inférence haute performance
DRAM	Restent indispensables dans les serveurs et systèmes entourant les GPU
LPDDR	Prend de l’ampleur dans les nouvelles plateformes IA plus intégrées
Capacité de production	Ne peut pas être augmentée du jour au lendemain ; requiert investissements et planification
Packaging avancé	Limite le rythme de production des mémoires empilées et des accélérateurs
Contrats anticipés	Offrent un avantage à ceux qui réservent leur capacité avant la hausse des prix

NVIDIA gagne aussi par sa planification

Les résultats de NVIDIA illustrent pourquoi cette capacité d’anticipation est si déterminante. Au troisième trimestre de son exercice fiscal 2026, la société a déclaré un chiffre d’affaires record de 57 milliards de dollars, en hausse de 62 % sur un an. Sa division centres de données a généré 51,2 milliards, soit une croissance de 66 % en glissement annuel. Jensen Huang a résumé la situation : les ventes de Blackwell étaient « hors échelle » et les GPU pour le cloud étaient en rupture de stock.

Lorsqu’une entreprise vend presque tout ce qu’elle peut produire, le problème ne concerne plus seulement la demande, mais aussi l’exécution industrielle. Il ne suffit pas d’avoir de nombreuses commandes : il faut aussi obtenir des wafers, de la mémoire, des substrats, assurer le packaging, l’alimentation électrique, la mise en rack, les réseaux et disposer de la capacité d’assemblage. NVIDIA joue à la fois le rôle d’un constructeur de semi-conducteurs et celui d’un coordinateur d’infrastructures mondiales.

La différence avec d’autres acteurs tient probablement là. Beaucoup d’entreprises technologiques ont bri their modèle sur le logiciel, le cloud ou l’intégration de services. NVIDIA, en revanche, a passé des décennies à travailler avec des fournisseurs de silicium, de mémoire, de cartes, de fabricants de serveurs et d’opérateurs de centres de données. Cette expérience lui confère un avantage réel en période de tension sur la chaîne d’approvisionnement.

Kress formule cette idée presque comme une critique vis-à-vis du marché : d’autres pouvaient commander de la mémoire, mais ne l’ont pas fait, peut-être par manque de vision face à l’ampleur de la demande. Dans une industrie où les délais de capacité se mesurent en années, agir en amont peut avoir des conséquences économiques considérables.

Rubin pourrait encore accentuer la pression

La prochaine grande étape sera avec Rubin, la plateforme de nouvelle génération de NVIDIA. Certains rapports de marché estiment que la demande de LPDDR associée à Rubin en 2027 pourrait dépasser la demande combinée d’Apple et Samsung dans les smartphones. C’est une projection extérieure, pas un chiffre officiel confirmé par NVIDIA, mais elle montre l’ampleur du défi à venir.

Jusqu’ici, Apple, Samsung et les fabricants de mobiles étaient de grands acheteurs de mémoire avancée. La montée en puissance de l’IA a changé cette hiérarchie. Un seul cycle d’accélérateurs pour centres de données peut rivaliser en demande avec des secteurs entiers de l’électronique grand public. L’impact de cette course sur l’inférence est également analysé dans notre article sur Cerebras et la vitesse d’inférence.

Ce déplacement entraîne des effets en cascade. Si les fabricants de mémoire priorisent les contrats à forte marge liés à l’IA, d’autres marchés risquent de subir des hausses de prix, des retards ou une disponibilité réduite. PC, smartphones, serveurs traditionnels, stockage, électronique industrielle : tous sont exposés à cette tension.

Marché impacté	Effet potentiel de la demande IA
Centres de données IA	Investissements accrus en HBM, LPDDR et systèmes complets
Serveurs traditionnels	Augmentation du coût des composants et délais plus longs
PC et portables	Hausse des prix de la DRAM et du stockage si la pénurie s’étend
Smartphones	Concurrence accrue pour la mémoire LPDDR avancée
Fabricants de mémoire	Plus de revenus, mais aussi plus de pression sur la capacité
Fournisseurs cloud	Besoin de réserver du matériel longtemps à l’avance

Les fabricants de mémoire en pleine accélération

La pénurie modifie aussi l’équilibre économique en Corée du Sud. SK Hynix et Samsung ont vu la valeur stratégique de leurs divisions mémoire exploser avec la demande IA. Chez Samsung, cette tension a atteint le domaine syndical, avec des dizaines de milliers de travailleurs menaçant de faire grève pour réclamer une participation plus équitable aux profits. Le conflit s’est produit à un moment critique, alors que l’on craignait qu’une paralysie n’impacte l’offre mondiale de DRAM et de NAND. Ces tensions sociales dans la chaîne semi-conducteurs sont aussi au cœur du malaise chez TSMC autour des bonus.

Cette situation montre que la chaîne de valeur de l’IA ne se limite pas à la Silicon Valley. Elle dépend aussi de grosses usines en Corée, à Taïwan, au Japon, aux États-Unis, et de fournisseurs de produits chimiques, de machines, de wafers et d’accords à long terme qui ne s’improvisent pas en pleine tension du marché.

Pour NVIDIA, réserver de la mémoire en amont constitue un avantage compétitif réel. Pour ses concurrents, cela peut s’avérer coûteux et tardif : payer plus cher tout en recevant le matériel bien plus tard. Cela impacte la rentabilité, les calendriers de lancement et la capacité à répondre à de grands contrats d’infrastructure.

La leçon : l’IA se construit aussi dans la chaîne d’approvisionnement

L’IA est généralement présentée comme une course de modèles, de paramètres et de logiciels. La pénurie de mémoire rappelle que c’est aussi une course industrielle. Celui qui ne sécurise pas ses composants critiques à temps peut se retrouver avec un excellent design sur le papier, mais incapable de le produire à grande échelle.

Cela concerne les fabricants de puces, les fournisseurs cloud, les startups IA, les gouvernements voulant des infrastructures souveraines et les grandes entreprises planifiant des déploiements internes. Réserver des GPU ne suffit plus : il faut aussi connaître le type de mémoire, ses fabricants, les contrats signés et les délais réels de livraison.

NVIDIA a intégré cette anticipation dans ses forces structurelles. La société ne se contente pas de vendre des accélérateurs : elle organise un système complet d’approvisionnement, de conception conjointe et de capacité future. Sur un marché où chaque génération d’IA nécessite plus de mémoire, d’énergie et de réseau, cette capacité à prévoir peut être plus difficile à reproduire qu’une fiche technique.

La pénurie de mémoire n’est pas un accident passager. Elle indique que l’IA entre dans une phase physique, industrielle et très capitalistique. Si les modèles peuvent être entraînés dans le cloud, celui-ci repose sur des usines, des circuits, des wafers, de la mémoire et des accords signés plusieurs années à l’avance. C’est là que NVIDIA semble avoir pris de l’avance.

Questions fréquentes sur la pénurie de mémoire et NVIDIA

Que dit la directrice financière de NVIDIA sur la mémoire ?

Colette Kress a confirmé que NVIDIA anticipait la hausse des prix et avait commandé de la mémoire à l’avance, en travaillant directement avec ses fournisseurs pour concevoir et réserver la capacité nécessaire.

Pourquoi la mémoire est-elle si cruciale pour l’IA ?

Parce que les accélérateurs IA ont besoin d’une large bande passante et d’une grande capacité pour entraîner les modèles, effectuer des inférences, transférer des données et gérer des contextes de plus en plus étendus.

La pénurie concerne-t-elle uniquement la HBM ?

Non. La pression sur la HBM peut réorienter les capacités industrielles, impactant aussi la DRAM, LPDDR et d’autres segments de mémoire utilisés dans les serveurs, PC et smartphones.

Quels avantages NVIDIA possède-t-elle face à ses concurrents ?

Outre ses GPU et son écosystème logiciel, NVIDIA a sécurisé l’approvisionnement en mémoire très en amont, ce qui lui confère une stabilité accrue en termes de coûts et de production.

Source : wccftech

X (Twitter) Facebook Pinterest LinkedIn Email

Maria Lafaye D.

Journaliste spécialisé dans les technologies, le cloud et l'intelligence artificielle, qui rédige en français à l'aide de l'IA pour des médias tels que Actualité Cloud.