L’IA exerce également une pression sur la mémoire NOR : l’autre goulot d’étranglement de 2026

SK hynix marque une étape avec la première NAND QLC de 321 couches : l'avenir du stockage pour l'ère de l'IA

Depuis plusieurs années, lorsque l’on évoquait une pénurie de mémoire, le débat tournait principalement autour de la DRAM et de la NAND. Cependant, en 2026, l’attention se déplace vers une composante moins médiatisée mais essentielle dans tout système moderne : la mémoire NOR flash. Celle-ci stocke le microprogramme (firmware), les séquences de démarrage et le code critique pour assurer la fiabilité du lancement de serveurs, accélérateurs, contrôleurs et cartes réseau.

La pression ne provient pas d’un seul facteur, mais d’un cocktail bien connu dans le secteur : un hype exponentiel autour de l’infrastructure pour l’Intelligence Artificielle, la réorganisation des capacités de production vers des produits plus rentables, et une industrie opérant encore avec des marges étroites pour absorber les pics de demande. Le constat est clair : lorsque le « petit » devient indispensable, il ne l’est plus vraiment.

De 3–5 puces par rack à plus de 30 : comment la facture évolue

Le premier signe d’alarme est la montée du contenu de NOR par système. Des rapports du marché asiatique, relayés par la presse européenne, indiquent qu’en racks de serveurs IA, le nombre de dispositifs NOR pourrait passer de 3 à 5, habituellement, à plus de 30 unités par rack dans des configurations avancées.

Un exemple fréquent aujourd’hui concerne les systèmes basés sur NVIDIA GB200 NVL72, où le « contenu » en NOR flash par rack dépasse déjà 600 dollars et pourrait atteindre 900 dollars d’ici deux ans si la demande et les prix se maintiennent dans leur tendance actuelle.
Il ne s’agit pas de dire que la NOR remplacera la HBM ou qu’elle rivalisera en bande passante avec la DRAM : elle s’est devenue un multiplicateur silencieux de coûts dans la croissance du nombre de composants et de cartes.

Pourquoi la NOR est si difficile à « retirer » de la conception

Contrairement à la NAND, la NOR se distingue par sa lecture aléatoire rapide et déterministe, sa capacité à prendre en charge la exécution-in-place (XIP) et sa fiabilité dans des contexts où le stockage du code est critique. Cela explique sa présence historique en automobile, industrie ou télécommunications, et désormais aussi dans les serveurs IA, où le démarrage sécurisé, le firmware de plusieurs contrôleurs et l’initialisation du système en font des éléments essentiels de la plateforme.

En somme : lorsque la complexité d’un design augmente — avec plus d’accélérateurs, de NICs, de contrôleurs et de couches de gestion — le besoin de firmware séparé, sécurisé et résilient s’amplifie. La NOR devient alors la localisation naturelle pour l’héberger.

La lutte pour la capacité : IA versus embarqué, automobile et industrie

Le problème ne se limite pas à la demande dans les data centers. La NOR reste une catégorie plus petite que la DRAM ou la NAND, et sa capacité de production ne s’étend pas aussi rapidement ni avec les mêmes économies d’échelle. Dès lors, toute augmentation supplémentaire liée à l’IA peut créer des frictions avec d’autres secteurs déjà dépendants de cette technologie : automobile (y compris par mise à jour OTA), industrie, IoT et systèmes embarqués en général.

Les rumeurs évoquent d’ailleurs une éventuelle hausse de prix en début d’année 2026 par de grands fournisseurs, avec des reports indiquant des augmentations jusqu’à 30 % pour certains produits, selon des sources économiques régionales.
Il faut lire entre les lignes : même lorsqu’une hausse n’est pas officiellement confirmée, le simple fait que le secteur la considère comme plausible indique que les négociations deviennent tendues.

Plus de puces « de démarrage » par système de mémoire avancée

Un autre aspect moins visible concerne l’impact des mémoires avancées sur les accélérateurs. Des médias asiatiques font état d’une augmentation du nombre de composants NOR associés lors de la transition entre différentes générations de mémoires haute performance, avec des modules ou sous-systèmes pouvant passer de 1–2 à 3–5 dispositifs dans certains scénarios liés à de nouvelles architectures.
Sans entrer dans des promesses commerciales, l’idée de fond est cohérente : plus la plateforme est sophistiquée, plus elle comporte de micro-composants support — et la NOR s’y trouve souvent parmi eux.

NOR 3D : la promesse pour sortir du blocage (mais pas pour demain)

Face à la demande croissante, la question revient : pourquoi ne pas augmenter simplement la densité et la capacité comme dans d’autres segments ? La réponse réside dans la technologie 3D NOR, qui consiste à empiler les cellules pour améliorer la densité tout en conservant la fiabilité indispensable aux usages de firmware et de code.
Macronix, par exemple, a été un acteur majeur dans ce domaine, présentant récemment des avancées en 3D NOR pour le secteur industriel.

Cependant, le secteur reste prudent : la migration vers la 3D NOR à grande échelle n’est pas immédiate. À court terme, la majorité des applications continueront à dépendre de la NOR traditionnelle, faisant de 2026 une année où la gestion de la pénurie prédominera plutôt que la solution technologique.

Implications pour le marché en 2026

La conclusion est claire : la NOR flash s’ajoute à la liste des composants où l’IA influence non seulement la performance, mais aussi la chaîne d’approvisionnement. Cela redéfinit les priorités :

  • Les conceptions deviennent plus sensibles à la « liste de matériaux » : en multipliant les composants, on multiplie aussi le firmware et les mémoires de support.
  • Les acheteurs se concentrent moins sur le prix unitaire et plus sur le risque d’approvisionnement : si la NOR manque, le système ne démarre pas, même si la HBM ou le GPU sont présents.
  • L’impact dépasse le domaine de l’IA : l’automobile et l’industrie entrent en compétition pour la même capacité.

La paradoxe est que, si la NOR n’est pas le « muscle » de l’IA, elle constitue l’un de ses tendons. Et quand un tendon se tend, le mouvement s’arrête.


Questions fréquentes

Pourquoi la pénurie de NOR flash impacte-t-elle les serveurs IA si la mémoire clé est la HBM ?
Parce que la NOR stocke généralement le firmware et le code de démarrage de plusieurs composants (contrôleurs, cartes, sous-systèmes). Sans cette couche, le système ne peut pas s’initialiser de manière fiable, même si la HBM et les GPU sont disponibles.

Quelle différence fondamentale existe-t-il entre la NOR flash et la NAND flash dans les centres de données ?
La NOR privilégie une lecture rapide, aléatoire et fiable pour le code/firmware (y compris l’exécution-in-place), tandis que la NAND est davantage utilisée pour le stockage massif à moindre coût et densité, sans pour autant remplacer le firmware critique.

Quels signaux indiquent que le marché de la NOR se tend en 2026 ?
Une hausse du nombre de puces NOR par rack dans les plateformes IA, une compétition accrue avec l’automobile et l’industrie pour la capacité, ainsi que des rumeurs récurrentes d’augmentations de prix ou de conditions commerciales plus strictes.

La NOR 3D résoudra-t-elle le problème à court terme ?
Elle peut contribuer à moyen terme en augmentant la densité et l’offre « utile », mais son déploiement à grande échelle n’est pas pour demain. En 2026, il est plus réaliste de résider dans une coexistence avec la NOR classique, la tension étant principalement liée à la capacité et aux allocations.

Source : eetimes

le dernier