SK Hynix accélère la course à la HBM4E avec des mémoires de 48 Go et 4 To/s

SK hynix achève le développement du HBM4 et se prépare à dominer la mémoire à large bande passante à l'ère de l'IA

SK Hynix a profité de Computex 2026 pour présenter la trajectoire de la prochaine génération de mémoire dédiée à l’intelligence artificielle. La société sud-coréenne a dévoilé une solution HBM4E capable d’atteindre 48 GB en une pile de 12 couches, avec un débit maximal allant jusqu’à 4 TB/s, anticipant ainsi les besoins futurs des accélérateurs de NVIDIA, AMD et autres fabricants de puces pour centres de données.

Ce lancement s’inscrit dans une course effrénée à la mémoire à haut débit. Au cours des deux dernières années, le discours sur l’IA s’est principalement concentré sur les GPU, mais la réalité est plus complexe : sans mémoire HBM suffisante, les accélérateurs ne peuvent alimenter leurs cœurs de calcul à la vitesse requise par les modèles de nouvelle génération. La mémoire devient ainsi l’un des goulots d’étranglement majeurs dans l’infrastructure IA, aux côtés de l’énergie, du refroidissement et des capacités réseau.

SK Hynix bénéficie d’une position stratégique. Selon Counterpoint Research, cité par Reuters, la société contrôlait environ 58 % du marché mondial de HBM au premier trimestre 2026, devançant Samsung et Micron, chacune avec près de 21 %. Son rôle en tant que fournisseur clé de NVIDIA l’a placé au cœur de la chaîne d’approvisionnement de l’IA, alors que les nouveaux systèmes Rubin et Rubin Ultra commencent à définir les futurs besoins.

HBM4E : une densité accrue avec moins de couches

La caractéristique la plus remarquable de cette démonstration est la densité. La HBM4E présentée par SK Hynix utilise des puces de 32 Gb, soit une augmentation de 33 % par rapport aux configurations précédentes. Cela permet d’atteindre 48 GB avec une pile de 12 couches, alors que la HBM4 de 48 GB était généralement associée à des designs de 16 couches. En pratique, la société peut ainsi proposer la même capacité avec une structure moins volumineuse, ce qui simplifie le packaging et peut faciliter l’intégration thermique.

Le deuxième progrès concerne le débit. La HBM4E de SK Hynix vise des vitesses pouvant atteindre 16 Gbps par pin, avec un débit maximal par module pouvant aller jusqu’à 4 TB/s. Cela constitue une amélioration significative par rapport à la HBM4, et un saut encore plus important par rapport à la HBM3E qui alimente actuellement de nombreux systèmes IA avancés. Ces données ont été relayées lors de Computex par Wccftech, à partir des informations affichées sur le stand de SK Hynix.

Génération Configuration notable Capacité Vitesse maximale Débit approximatif
HBM3E 12-Hi 36 GB jusqu’à 9,2-9,8 Gbps environ 1,2 TB/s
HBM4 16-Hi 48 GB jusqu’à 11,7 Gbps près de 3 TB/s
HBM4E 12-Hi 48 GB jusqu’à 16 Gbps jusqu’à 4 TB/s

Ce tableau synthétise l’évolution technologique, mais il convient de l’interpréter avec prudence. En réalité, la performance finale des modules HBM ne dépend pas uniquement de leur capacité, mais aussi de l’interface, du packaging, de la logique intégrée, du design de l’accélérateur, de la consommation énergétique, de la gestion thermique et de la validation client. Néanmoins, la trajectoire vers un débit de 4 TB/s par module confirme que l’IA requiert une alimentation toujours plus rapide pour des chips de plus en plus puissants.

Ce progrès est particulièrement critique pour Rubin Ultra, la plateforme NVIDIA attendue pour 2027. Reuters rapporte que Chey Tae-won, président de SK Group, a déclaré lors de Computex que SK Hynix souhaite devenir un fournisseur majeur de HBM pour Vera Rubin, et que la feuille de route du HBM4E sera ajustée en fonction de la demande, NVIDIA étant la référence principale en ce moment.

La mémoire influence désormais la conception des accélérateurs IA

La RAM HBM n’est pas une mémoire ordinaire. Elle s’empile verticalement et s’intègre très près du processeur à l’aide de technologies d’emballage avancées, permettant de transférer d’énormes volumes de données tout en consommant moins d’énergie par bit transféré, comparé à d’autres architectures. Pour l’entraînement et l’inférence de modèles d’IA, cette proximité est essentielle : un accélérateur peut disposer d’une capacité de calcul énorme, mais si les données n’arrivent pas à temps, sa puissance sous-utilisée ne sert à rien.

La transition du HBM3E au HBM4 puis HBM4E s’accompagne d’une croissance exponentielle des modèles, des fenêtres de contexte, des architectures multimodales, et des agents avec état prolongé. Par ailleurs, les futures architectures comptent plus d’accélérateurs par rack, davantage de mémoire par système et des réseaux internes plus rapides, augmentant la pression sur la capacité mémoire.

SK Hynix insiste sur le fait que l’augmentation de la vitesse ne suffit pas : il faut également amplifier la production. Chey Tae-won a expliqué lors de Computex que la société prévoit de doubler sa capacité de wafers dans les cinq prochaines années pour répondre à la demande IA croissante. Il a aussi mis en garde contre d’éventuels goulots d’étranglement de la mémoire jusqu’en 2030, tout en soulignant que des hausses de prix trop brutales pourraient freiner une croissance durable.

Ce constat reflète le dilemme de l’industrie. La demande est énorme, et les fabricants peuvent améliorer leurs marges et leurs prix. Mais si la mémoire HBM devient trop coûteuse, cela pourrait freiner certains projets, inciter à ajuster la configuration ou à rechercher des architectures alternatives. L’IA a besoin de mémoire, mais celle-ci doit rester abordable pour pérenniser le développement.

Samsung et Micron ne restent pas inactifs. Selon Reuters, Samsung a déjà commencé à distribuer des échantillons de HBM4E à ses clients, cherchant à regagner du terrain face à SK Hynix, qui a devancé avec HBM3E et ses liens avec NVIDIA. Micron a également renforcé son engagement dans la HBM pour les plateformes IA. La compétition s’intensifiera dans la seconde moitié de la décennie.

NAND empilée pour IA : la nouvelle orientation de SK Hynix

La présence de SK Hynix à Computex ne se limite pas à la HBM. La société a aussi présenté des technologies de NAND adaptées à l’IA, notamment AI-N B, une solution visant à combiner une architecture de type HBM, en matière d’empilement et de connectivité, avec des capacités proches du stockage flash. L’idée est de faire un compromis : plus de capacité que la HBM traditionnelle, avec un débit supérieur à celui d’un SSD classique.

Ce concept rejoint l’intérêt croissant pour le High Bandwidth Flash ou HBF, une technologie que SK Hynix et SanDisk cherchent à standardiser. Le HBF est une mémoire basée sur NAND, conçue pour les serveurs d’inférence IA, située entre la HBM DRAM et les SSD classiques. Selon Tom’s Hardware, cette approche vise à offrir une capacité bien supérieure à la HBM, tout en étant moins coûteuse et moins énergivore, avec une latence différente, et un rôle plus axé sur la mémoire ou le stockage haute capacité à large bande.

La différence entre entraînement et inférence permet de mieux comprendre cette stratégie. L’entraînement requiert une capacité maximale de bande passante et une faible latence pour ajuster des modèles gigantesques. L’inférence, surtout en déploiements massifs, exige aussi une grande capacité pour gérer des lots volumineux, un contexte étendu, la récupération d’informations, des caches ou des données utilisateur. Une mémoire basée sur NAND, si elle offre un débit suffisant et une intégration adaptée, pourrait soulager la pression sur la HBM.

Il ne s’agit pas d’un remplacement direct. La HBM et la HBF peuvent coexister : la HBM reste la mémoire ultra-rapide en liaison directe avec l’accélérateur, tandis que la NAND pourrait constituer une couche de capacité supplémentaire pour l’inférence, la récupération de connaissances et les bases vectorielles. Des recherches récentes en architecture explorent déjà cette voie, notamment avec des NAND 3D pour accélérer l’inférence locale ou les recherches vectorielles à grande échelle.

LPCAMM2 et V9 NAND : l’IA arrive aussi chez le client

SK Hynix a aussi présenté des produits destinés au marché final, comme son premier module LPCAMM2 de 96 GB, basé sur LPDDR5X avec une technologie 1nm, atteignant jusqu’à 9,6 Gbps. Ces modules sont pensés pour des plateformes compactes, portables haute performance ou PC IA, où la mémoire soudée ou modulaire à faible consommation est de plus en plus privilégiée face aux SO-DIMM classiques.

Par ailleurs, la société a montré des solutions NAND V9 en versions QLC et TLC, destinées à des SSD compactes ou à des dispositifs à faible consommation. Si l’attention médiatique reste centrée sur la HBM, ces produits illustrent que l’IA influence toute la gamme de la mémoire : des data centers aux ordinateurs portables, en passant par les stations de travail, le stockage local ou les appareils de nouvelle génération.

La tendance est claire : SK Hynix ne veut pas se limiter à fournir une seule composante pour NVIDIA. L’ambition est d’intégrer davantage la mémoire dans l’écosystème IA : HBM pour la formation, NAND avancée pour l’inférence et le stockage, LPCAMM2 pour les PC IA, et des solutions spécialisées pour serveurs et systèmes compacts.

La course à l’IA ne se joue plus seulement sur la puissance des puces, mais aussi sur la capacité à alimenter ces puces avec des données. Qui peut fabriquer suffisamment de mémoire, l’emballer efficacement, et garantir une chaîne logistique stable sur le long terme, aura un avantage stratégique. La HBM4E de 48 GB et 4 TB/s de SK Hynix n’est pas qu’une évolution technique : c’est un symbole de l’importance croissante de la mémoire dans la géopolitique et l’économie de l’intelligence artificielle.

Questions fréquentes

Que a présenté SK Hynix lors de Computex 2026 ?
Une solution HBM4E de 48 GB en une pile de 12 couches, avec des puces de 32 Gb, des vitesses jusqu’à 16 Gbps par pin, et un débit maximal indiqué de 4 TB/s.

Pourquoi la HBM4E est-elle cruciale pour l’IA ?
Parce que les accélérateurs IA nécessitent de transférer de vastes volumes de données entre la mémoire et le processeur. Plus de bande passante et de capacité permettent d’exploiter pleinement les GPUs et autres puces avancées.

Quel lien avec NVIDIA Rubin Ultra ?
La HBM4E pourrait devenir la mémoire clé pour les systèmes post-Rubin, comme Rubin Ultra. SK Hynix vise à conserver son rôle de principal fournisseur de mémoire pour NVIDIA dans l’écosystème IA avancé.

Qu’est-ce que AI-N B ou HBF ?
Ce sont des architectures de mémoire basées sur NAND à haut débit, conçues pour rapprocher capacité et performance dans l’inférence IA. Elles ne remplacent pas directement la HBM mais la complètent.

Source : wccftech

le dernier