Pénurie DRAM IA : tension extrême jusqu’en 2027 chez Samsung, SK Hynix et Micron

Pénurie DRAM IA modules mémoire datacenter

La pénurie DRAM IA n’est plus un simple accident de parcours sur le marché des semi-conducteurs : c’est désormais une contrainte structurelle qui va peser sur toute l’industrie technologique jusqu’en 2027 au minimum. Selon Nikkei Asia et Counterpoint Research, les trois géants de la mémoire — Samsung, SK Hynix et Micron — ne couvriront qu’environ 60 % de la demande mondiale de DRAM à la fin 2027. Un écart historique qui traduit une réalité brutale : la course à l’intelligence artificielle absorbe des capacités industrielles que le reste de l’économie numérique ne pourra pas récupérer à court terme.

Le déséquilibre est tel que, pour revenir à l’équilibre, il faudrait une croissance de la production de 12 % par an en 2026 et 2027, alors que les plans industriels annoncés ne visent qu’un rythme de 7,5 %. Ce différentiel, combiné aux arbitrages stratégiques des fondeurs en faveur de la mémoire à haute bande passante (HBM), configure un scénario que les analystes n’hésitent plus à qualifier de super-cycle : prix élevés, disponibilité irrégulière et arbitrages douloureux pour l’ensemble de la chaîne de valeur IT.

D’où vient la pénurie : HBM, hyperscalers et datacenters IA

La mécanique de la crise est moins conjoncturelle qu’il n’y paraît. Pendant près d’une décennie, la DRAM a été une industrie cyclique dominée par des phases d’abondance suivies de corrections brutales des prix. L’explosion des charges de travail d’intelligence artificielle a fait voler en éclats ce schéma. Chaque accélérateur NVIDIA H200, H200e ou Blackwell embarque entre 141 et 192 Go de HBM3e, et la prochaine génération Rubin poussera le curseur au-delà de 288 Go. Multiplié par les millions de puces commandées par les hyperscalers, le besoin de mémoire à haute bande passante pulvérise toutes les projections antérieures.

Le problème est que la HBM ne se fabrique pas à partir des mêmes ressources qu’une DRAM classique. Micron le reconnaît noir sur blanc dans son dernier rapport réglementaire 10-Q : produire un bit de HBM mobilise davantage de wafers et d’espace en salle blanche qu’un bit de DRAM standard sur le même nœud. Chaque gigaoctet de HBM déployé dans un datacenter IA se traduit mécaniquement par une réduction de la capacité disponible pour les serveurs généralistes, les PC portables ou les smartphones. L’effet est amplifié par le fait que la HBM offre des marges nettement supérieures, ce qui pousse les fondeurs à prioriser cette gamme.

S’ajoute une dimension géopolitique inédite. Les hyperscalers américains ont sécurisé l’essentiel de la production 2026 via des contrats d’achat anticipé, et les fonds souverains du Golfe pré-paient désormais des tranches entières de capacité pour leurs projets de cloud souverain. Résultat : avant même que les usines ne soient livrées, une part significative de leur production est déjà réservée, laissant peu d’oxygène au marché spot.

Les trois grands fabricants et leurs arbitrages

Face à cette demande insatiable, les trois acteurs qui concentrent près de 95 % du marché mondial de la DRAM ne réagissent pas de la même manière. Leurs choix capacitaires dessinent la carte de l’approvisionnement mémoire pour les trois prochaines années.

Samsung : rattrapage accéléré sur la HBM4

Longtemps en retard sur SK Hynix dans la course à la HBM, Samsung a annoncé début 2026 le lancement de la production massive de HBM4 et les premières livraisons commerciales à ses clients stratégiques, dont NVIDIA. Le coréen a réorienté une partie significative de ses lignes DDR5 vers la HBM dans ses usines de Pyeongtaek, un arbitrage qui soulage ses marges mais aggrave la tension sur la mémoire classique. Samsung mise également sur une intégration verticale plus poussée, avec des solutions hybrides combinant HBM et logique custom pour les grands acteurs du cloud.

SK Hynix : le leader historique consolide sa position

SK Hynix reste le fournisseur de référence de NVIDIA pour la HBM3e et capte, selon les dernières estimations de TrendForce, plus de 50 % du marché mondial de la mémoire à haute bande passante. L’entreprise a lancé ce mois-ci la production à grande échelle dans sa nouvelle fab M15X de Cheongju, et prépare l’extension de son site M14 pour 2027. Mais le coréen reconnaît lui-même que cette montée en cadence ne suffira pas à compenser le déséquilibre global, d’autant que ses contrats cadres avec les hyperscalers américains absorbent plus de 80 % des volumes prévus pour l’année à venir.

Micron : pari américain et capacités bloquées jusqu’en 2028

Micron adopte la posture la plus assumée du trio : toute sa production HBM pour l’année civile 2026 est déjà engagée en prix et en volume, sans exception. Le fondeur américain vient d’acquérir une nouvelle installation à Tongluo, à Taïwan, pour augmenter sa capacité en DRAM avancée. Problème : Micron prévoit que ces nouvelles lignes ne commenceront à livrer des volumes significatifs qu’à partir de son exercice fiscal 2028. Entre-temps, le groupe d’Idaho mise sur ses méga-projets de fabs à New York et en Idaho, largement subventionnés par le CHIPS Act, mais dont la mise en service opérationnelle reste conditionnée à la disponibilité des équipements lithographiques ASML, eux-mêmes sous tension.

Impact sur les prix : serveurs, PC et smartphones

La répercussion sur les prix est déjà en cours et s’annonce brutale. Counterpoint Research anticipait dès janvier 2026 une hausse des prix de la mémoire comprise entre 40 et 50 % sur le quatrième trimestre 2025 et le premier trimestre 2026, suivie d’une envolée supplémentaire d’environ 20 % au deuxième trimestre. Sur le segment serveurs, les modules RDIMM DDR5 haute densité (128 et 256 Go) ont vu leurs prix contractuels doubler en neuf mois, un mouvement inédit depuis la crise de 2017.

Pour le grand public, l’impact est plus diffus mais réel. Counterpoint a revu à la baisse ses prévisions d’expéditions mondiales de smartphones pour 2026, avec un recul anticipé de 2,1 %, directement lié au renchérissement de la mémoire dans la facture matérielle. Les constructeurs de PC portables commencent à annoncer des hausses de prix catalogue de 5 à 8 % sur les gammes équipées de 16 Go de RAM et plus, tandis que certains OEM envisagent de revenir à des configurations 8 Go sur l’entrée de gamme. Le marché de la RAM desktop en kit, particulièrement sensible, a déjà vu les prix du DDR5 grand public bondir de plus de 70 % depuis septembre 2025.

Le scénario le plus probable n’est pas celui d’une rupture totale, mais d’une disponibilité irrégulière couplée à des prix durablement élevés. Les segments les plus exposés seront ceux où la marge du fabricant est la plus faible : entrée de gamme mobile, PC grand public et électronique embarquée. À l’inverse, les produits premium absorberont le surcoût via leurs prix catalogue, sans que les consommateurs finaux ne mesurent pleinement l’ampleur du transfert de valeur vers les fondeurs.

Conséquences pour les clouds hyperscalers

Pour AWS, Microsoft Azure, Google Cloud et Oracle Cloud Infrastructure, la pénurie DRAM IA est à la fois un problème et un avantage compétitif. Ceux qui ont sécurisé tôt leurs approvisionnements — typiquement les trois leaders — disposent d’une visibilité jusqu’en 2027 sur leurs capacités d’expansion. Les acteurs de second rang, en revanche, se retrouvent en position défavorable : impossible d’agrandir rapidement un cluster GPU sans disposer de la mémoire associée.

Cette dynamique se traduit déjà dans les tarifs cloud. Les instances GPU optimisées pour l’IA ont vu leur prix horaire augmenter de 15 à 25 % sur les douze derniers mois chez les principaux fournisseurs, après plusieurs années de baisse continue. Les entreprises qui basaient leur stratégie IA sur l’hypothèse d’une déflation régulière du coût du calcul doivent désormais recalculer leurs TCO, avec un impact direct sur la rentabilité des projets d’intégration d’IA contextuelle dans les outils métier.

Les hyperscalers explorent plusieurs stratégies de mitigation. La première consiste à multiplier les partenariats directs avec les fondeurs, comme l’accord pluriannuel Microsoft-SK Hynix signé fin 2025. La deuxième passe par le développement de silicium maison intégrant de la mémoire embarquée : Google avec ses TPU v7, Amazon avec Trainium 3, et Microsoft avec Maia 200. Ces puces custom permettent d’optimiser le rapport mémoire/calcul et de réduire la dépendance aux GPU génériques NVIDIA. La troisième voie, plus discrète, consiste à recycler et prolonger la durée de vie des infrastructures existantes, au prix d’une densité énergétique moindre par rack.

Quand la tension retombera-t-elle

La question du calendrier divise les analystes. Le consensus actuel table sur un premier desserrement à la charnière 2027-2028, lorsque les capacités annoncées par Micron à Tongluo et par SK Hynix à Cheongju entreront en production de volume. Mais cette projection repose sur trois hypothèses fragiles : que la demande IA plafonne aux niveaux anticipés, que les équipements lithographiques ASML soient livrés dans les délais, et qu’aucun choc géopolitique majeur n’affecte la chaîne d’approvisionnement taïwanaise.

Micron elle-même prévoit que le marché de la HBM pourrait atteindre 100 milliards de dollars en 2028, un chiffre qui dépasse à lui seul la taille totale du marché DRAM mondial en 2024. Si cette projection se confirme, la mémoire cessera définitivement d’être perçue comme un composant banalisé pour devenir un actif stratégique, au même titre que les GPU ou les brevets de fabrication avancée. Les gouvernements l’ont bien compris : les subventions américaines, européennes et japonaises pour relocaliser la production de mémoire dépassent désormais les 80 milliards de dollars cumulés, sans qu’aucun de ces projets ne soit encore pleinement opérationnel.

En parallèle, des technologies de rupture pourraient redistribuer les cartes à plus long terme. Les travaux sur les memristors de nouvelle génération et les mémoires non volatiles haute performance progressent, mais leur arrivée à maturité industrielle ne se produira pas avant la seconde moitié de la décennie. À court et moyen terme, c’est donc bien la DRAM, et plus particulièrement la HBM, qui dictera le rythme du déploiement de l’intelligence artificielle mondiale.

Pour les DSI et les décideurs IT, le message est clair : il faut intégrer dès maintenant la contrainte mémoire dans la planification des projets 2026-2028. Cela passe par une anticipation plus longue des commandes serveurs, une négociation plus agressive des contrats cloud pluriannuels, et une réflexion sérieuse sur l’efficience mémoire des applications. L’époque où la RAM était une commodité abondante et bon marché est officiellement révolue.

Questions fréquentes

Pourquoi la pénurie DRAM IA touche-t-elle aussi les PC et smartphones ?

Parce que les fondeurs Samsung, SK Hynix et Micron réorientent leurs capacités de production vers la HBM, beaucoup plus rentable. Or produire un bit de HBM mobilise davantage de wafers et d’espace en salle blanche qu’un bit de DRAM standard. La mémoire destinée aux PC, serveurs classiques et smartphones diminue donc mécaniquement, ce qui pousse les prix à la hausse sur l’ensemble du marché.

Quand les prix de la mémoire commenceront-ils à redescendre ?

Les prévisions actuelles anticipent un premier desserrement entre fin 2027 et 2028, lorsque les nouvelles capacités de Micron à Tongluo et de SK Hynix à Cheongju entreront en production de volume. Avant cette échéance, le marché restera tendu avec des hausses cumulées pouvant dépasser 70 % sur le DDR5 grand public selon Counterpoint Research.

Quel impact sur les tarifs des clouds hyperscalers ?

Les instances GPU optimisées pour l’IA ont vu leurs prix horaires augmenter de 15 à 25 % sur les douze derniers mois chez AWS, Azure et Google Cloud. Les hyperscalers ayant sécurisé leurs approvisionnements HBM via des contrats pluriannuels disposent d’un avantage concurrentiel net face aux acteurs de second rang qui peinent à étendre leurs clusters IA.

Peut-on parler d’une rupture totale d’approvisionnement en RAM ?

Non. Le scénario probable est une disponibilité irrégulière couplée à des prix durablement élevés, plutôt qu’une disparition complète des produits. Les segments entrée de gamme mobile et PC grand public seront les plus exposés, tandis que les produits premium absorberont le surcoût via leurs tarifs catalogue.

Pourquoi Micron affirme que sa production HBM 2026 est déjà vendue ?

Parce que les hyperscalers américains, NVIDIA et les fonds souverains du Golfe ont sécurisé par des contrats d’achat anticipé l’intégralité des volumes HBM disponibles. Cette stratégie de pré-vente protège les marges de Micron mais limite toute capacité de réponse à une demande imprévue, aggravant la pénurie DRAM IA sur le marché spot.

le dernier