La pénurie de mémoire est devenue l’un des principaux points de tension dans l’industrie technologique. Elle ne concerne plus uniquement le prix des modules de mémoire DRAM de consommation ou des serveurs traditionnels. La demande croissante en intelligence artificielle a poussé la pression jusqu’à la mémoire HBM, LPDDR et autres composants essentiels à la construction d’accélérateurs, de systèmes intégrés et de grands clusters de centres de données.

Dans ce contexte, les déclarations de Colette Kress, directrice financière de NVIDIA, ont laissé peu de place au doute : la société considère que de nombreux concurrents ont réagi tardivement. Lors d’un entretien avec l’analyste Tae Kim, Kress a expliqué que NVIDIA anticipait déjà la hausse des prix et avait commandé de la mémoire longtemps à l’avance. Son message était clair : alors que d’autres s’étaient laissés surprendre par l’augmentation des coûts, NVIDIA l’avait prévu depuis le début.

Cette remarque revêt une importance particulière, car elle révèle un avantage moins visible que la puissance des GPU : NVIDIA ne domine pas uniquement grâce à ses puces performantes ou à un écosystème logiciel mature. Elle maîtrise également la gestion de sa chaîne d’approvisionnement en anticipant les besoins bien avant ses rivaux. À l’ère de l’IA, prévoir la disponibilité de la mémoire peut s’avérer aussi crucial que la conception même de l’accélérateur.

La mémoire devient le nouveau goulot d’étranglement

Depuis plusieurs années, le débat autour de l’intelligence artificielle se concentre principalement sur les GPU. Les modèles H100, H200, B200, Blackwell, Rubin, MI300X ou TPU sont désormais des noms courants parmi les entreprises, investisseurs et responsables d’infrastructure. Cependant, chaque nouvelle génération d’accélérateurs nécessite d’importantes quantités de mémoire haute performance pour alimenter les modèles, supporter des fenêtres de contexte plus longues et transférer des données à grande vitesse.

La mémoire HBM (High Bandwidth Memory) est devenue l’un des éléments les plus convoités du marché. Son architecture en plusieurs couches, la large bande passante qu’elle offre, et sa proximité avec le processeur en font un composant idéal pour les applications IA. Mais cela la rend aussi plus complexe à fabriquer et à intégrer. Augmenter la capacité de mémoire HBM implique de déplacer une partie de l’effort industriel depuis d’autres types de mémoire. Résultat : une pression qui s’étend également à la DRAM conventionnelle, LPDDR et autres segments.

Kress a souligné que NVIDIA ne se contente pas d’acheter ce qui est disponible sur le marché. La société collabore avec les fabricants de mémoire dès la phase de conception, leur indique les configurations nécessaires, et planifie avec eux la capacité à venir. Selon ses propos, NVIDIA travaille avec les trois principaux fournisseurs de mémoire, et non avec un seul. Cette coordination précoce lui permet d’assurer l’approvisionnement, d’ajuster les volumes, et d’éviter de dépendre du marché spot lorsque les prix ont déjà flambé.

Élément Importance pour l’IA
HBM Offre une bande passante importante pour l’entraînement et l’inférence haute performance
DRAM Restent indispensables dans les serveurs et systèmes qui entourent les GPU
LPDDR Peut prendre de l’ampleur dans les nouvelles plateformes et systèmes IA plus intégrés
Capacité de production Ne peut pas être augmentée du jour au lendemain ; elle requiert investissements et planification
Packaging avancé Limite le rythme de production des mémoires empilées et des accélérateurs
Contrats anticipés Offrent un avantage à ceux qui réservent leur capacité avant la hausse des prix

NVIDIA gagne non seulement par ses puces, mais aussi par sa planification

Les résultats de NVIDIA illustrent parfaitement pourquoi cette capacité d’anticipation est si déterminante. Au troisième trimestre de son exercice fiscal 2026, la société a déclaré un chiffre d’affaires record de 57 milliards de dollars, en hausse de 62 % par rapport à l’année précédente. Sa division centres de données a généré 51,2 milliards, soit une croissance de 66 % en glissement annuel. Jensen Huang a résumé cette situation en une phrase révélatrice : les ventes de Blackwell étaient “hors échelle” et les GPU pour le cloud étaient en rupture de stock.

Lorsque qu’une entreprise vend presque tout ce qu’elle peut produire, le problème ne concerne plus seulement la demande, mais aussi l’exécution industrielle. Il ne suffit pas d’avoir de nombreux ordres : il faut aussi obtenir des wafers, de la mémoire, des substrats, assurer le packaging, l’alimentation électrique, la mise en rack, les réseaux, et disposer de la capacité d’assemblage. À ce stade, NVIDIA joue à la fois le rôle d’un constructeur de semi-conducteurs et celui d’un coordinateur d’infrastructures mondiales.

La différence avec d’autres acteurs réside probablement là. Beaucoup d’entreprises technologiques ont construit leur modèle sur le logiciel, le cloud ou l’intégration de services. NVIDIA, en revanche, a passé des décennies à travailler avec des fournisseurs de silicium, de mémoire, de cartes, de fabricants de serveurs et d’opérateurs de centres de données. Toute cette expérience lui confère un avantage dans un contexte de tension sur la chaîne d’approvisionnement.

Kress a formulé cette idée presque comme une critique vis-à-vis du marché : d’autres pouvaient également commander de la mémoire, mais ne l’ont pas fait, peut-être par manque de vision ou de conviction face à l’ampleur de la demande. Dans une industrie où les délais de capacité se mesurent en années, agir en amont — dès l’annonce — peut avoir des conséquences économiques majeures.

Rubin pourrait encore accentuer la pression

La prochaine grande étape sera avec Rubin, la plateforme de nouvelle génération de NVIDIA. Certains rapports de marché évaluent que la demande de LPDDR associée à Rubin en 2027 pourrait dépasser la demande combinée d’Apple et Samsung dans les smartphones. Il s’agit d’une projection extérieure, non d’un chiffre officiel confirmé par NVIDIA, mais elle montre bien l’ampleur du défi à venir.

Jusqu’ici, le marché était habitué à ce que Apple, Samsung et d’autres fabricants de mobiles soient de grands acheteurs de mémoire avancée. La montée en puissance de l’IA a changé cette hiérarchie. Un seul cycle d’accélérateurs pour centres de données peut rivaliser en demande avec des secteurs entiers de l’électronique grand public.

Ce déplacement entraîne des effets en cascade. Si les fabricants de mémoire priorisent les contrats à forte marge liés à l’IA, d’autres marchés risquent de subir des hausses de prix, des retards ou une disponibilité limitée. PC, smartphones, serveurs traditionnels, stockage, électronique industrielle, tous sont exposés à cette tension croissante.

Marché impacté Effet potentiel de la demande IA
Centres de données IA Investissements accrus en HBM, LPDDR et systèmes complets
Serveurs traditionnels Augmentation du coût des composants et délais plus longs
PC et portables Hausse des prix de la DRAM et du stockage si la pénurie s’étend
Smartphones Concurrence accrue pour la mémoire LPDDR avancée
Fabricants de mémoire Plus de revenus, mais également plus de pression sur la capacité
Fournisseurs cloud Besoin de réserver du matériel longtemps à l’avance

Les fabricants de mémoire vivent une véritable bulle

La pénurie modifie également l’équilibre social et économique en Corée du Sud. SK Hynix et Samsung ont vu la valeur stratégique de leurs divisions mémoire exploser avec la demande liée à l’IA. Chez Samsung, cette tension a atteint le domaine syndical, avec des dizaines de milliers de travailleurs menacés par une grève pour réclamer une participation plus équitable aux profits issus de la croissance de la mémoire. Le conflit a eu lieu à un moment particulièrement critique, alors que l’on craignait qu’une paralysie n’impacte l’offre mondiale de DRAM et de NAND.

Ce contexte montre que la chaîne de valeur de l’IA ne se limite pas à Silicon Valley. Elle dépend aussi de grosses usines en Corée, à Taïwan, au Japon, aux États-Unis, et auprès de fournisseurs de produits chimiques, de machines, d’obleas et d’accords à long terme, qui ne s’improvisent pas en pleine tension du marché.

Pour NVIDIA, réserver de la mémoire en amont constitue un avantage compétitif certain. Pour ses concurrents, cela peut s’avérer coûteux et tardif : payer plus cher, tout en recevant leur matériel bien plus tard. Cela impacte la rentabilité, les calendriers de lancement et la capacité à répondre à de grands contrats d’infrastructure.

La leçon pour l’industrie : l’IA se construit aussi dans la chaîne d’approvisionnement

L’intelligence artificielle est généralement présentée comme une course de modèles, paramètres et logiciels. Mais la pénurie de mémoire rappelle qu’il s’agit aussi d’une véritable course industrielle. Celui qui ne sécurise pas ses composants critiques à temps peut se retrouver avec un excellent design sur le papier, mais incapable de le produire à grande échelle.

Cela concerne les fabricants de puces, les fournisseurs cloud, les startups IA, les gouvernements voulant des infrastructures souveraines, et aussi les grandes entreprises planifiant des déploiements internes. Réserver des GPU ne suffit plus : il faut aussi connaître le type de mémoire, ses fabricants, les contrats signés, et les délais réels de livraison.

NVIDIA a intégré cette anticipation dans une de ses forces. La société ne se contente pas de vendre des accélérateurs : elle organise un système complet d’approvisionnement, de conception conjointe et de capacité future. Sur un marché où chaque génération d’IA nécessite plus de mémoire, d’énergie et de réseau, cette capacité à prévoir peut être plus difficile à reproduire qu’une fiche technique.

La pénurie de mémoire ne constitue pas un accident passager. Elle indique que l’IA entre dans une phase physique, industrielle et très capitalistique. Si les modèles peuvent être entraînés dans le cloud, celui-ci repose sur des usines, des circuits, des wafers, de la mémoire et des accords signés plusieurs années à l’avance. C’est là que NVIDIA semble avoir anticipé le problème avant beaucoup d’autres.

Questions fréquemment posées

Quedit la directrice financière de NVIDIA sur la mémoire ?
Colette Kress a confirmé que NVIDIA anticipait la hausse des prix et avait commandé de la mémoire en avance, travaillant directement avec ses fournisseurs pour concevoir et réserver la capacité.

Pourquoi la mémoire est-elle si cruciale pour l’IA ?
Parce que les accélérateurs IA nécessitent un large bande passante et une grande capacité pour entraîner les modèles, effectuer des inférences, transférer des données et gérer des charges de travail avec des contextes de plus en plus étendus.

La pénurie concerne-t-elle uniquement la HBM ?
Non. La pression sur la HBM peut entraîner une délocalisation des capacités industrielles, impactant également la DRAM, LPDDR et d’autres segments de mémoire utilisés dans les serveurs, PC et smartphones.

Quels avantages NVIDIA possède-t-elle face à ses concurrents ?
Outre ses GPU et son écosystème logiciel, NVIDIA semble avoir sécurisé l’approvisionnement en mémoire très en amont, ce qui lui confère une stabilité accrue en termes de coûts et de production.

Source : wccftech