La période de fêtes des bonnes affaires dans le secteur de la mémoire et du stockage est révolue. Ce qui avait débuté comme un rebond après le plongeon de 2022-2023 s’est transformé en une pénurie généralisée et persistante qui touche désormais à la fois la DRAM, la NAND flash et les disques durs (HDD), une situation exceptionnelle au cours de la dernière décennie. La cause fondamentale est claire : les centres de données dédiés à l’IA consomment la capacité mondiale à un rythme que les fabricants et foundries n’ont ni la volonté ni la possibilité d’accroître aussi rapidement, après des années de cycles tourmentés de surinvestissement et de chute des prix.
Ce phénomène se traduit par un amincissement de l’offre dans tous les segments : depuis les modules DDR4 et les SSD grand public jusqu’aux archits all-flash pour entreprises et aux HDD nearline de grande capacité. Les géants du cloud (hyperescale) se réservant la majorité de la production à travers des contrats pluriannuels, le reste du marché doit se disputer le peu d’offre restante… à des prix en hausse.
De la surproduction au rationnement : comment le marché a changé de face
En 2022 et début 2023, la NAND et la DRAM se vendaient en dessous de leurs coûts. En réponse, les fabricants ont effectué des réductions drastiques de production, ce qui a vidé les inventaires, puis, en deuxième moitié de 2023, a fait exploser les prix spot et ceux des contrats. Par exemple, les 512 Gb TLC en NAND ont doublé leur prix en seulement six mois, et la tendance s’est immédiatement fait sentir en rayons : un SSD 2 To qui coûtait environ 120 $ à Noël est passé à 175–180 $ quelques semaines plus tard.
Les retournements dans la DRAM sont apparus avec un trimestre de retard, mais le pattern était identique : les DDR4 pour PC, qui semblaient en liquidation en 2023, ont soudainement connu une baisse de l’offre lorsque les lignes de fabrication ont commencé à se fermer. Certains analystes prévoient, pour le troisième trimestre 2025, une croissance trimestrielle de +38 à 43 % pour la DDR4 PC et de +28 à 33 % pour le serveur. La GDDR s’est aussi tendue : avec le passage à GDDR7 pour la nouvelle génération de GPU, la GDDR6 a augmenté d’environ 30 %. La DDR5 progresse plus lentement, mais affiche une tendance à la hausse.
Les HDD, traditionnellement relégués lorsque la flash monte en force, ne sont pas épargnés : certains fabricants ont signalé des augmentations de 5 à 10 %, et selon des sources de suivi, il existe une pénurie de modèles nearline de grande capacité (plus de 20 To) avec des délais qui s’allongent au-delà d’un an dans certains cas. La pénurie de nearline entraîne une migration de certaines warm data vers du flash (QLC), accentuant la pression sur la NAND.
L’origine principale : la « diète » des centres de données dédiés à l’IA
Chaque cycle de mémoire trouve son déclencheur. Il y a eu une époque où c’étaient les smartphones; ensuite, les ordinateur portables SSD; puis, le cloud. Aujourd’hui, c’est l’IA. La formation de modèles de langage et le déploiement à grande échelle d’inférences nécessitent des centaines de GB de DRAM et plusieurs TB de flash par nœud GPU, avec des milliers de nœuds par cluster. La demande en mémoire et stockage est structurelle, croissant avec chaque nouvelle génération de GPU et de taille de modèle.
En conséquence, les hyperclouds et laboratoires d’IA bloquent des approvisionnements pour plusieurs années. Certains nœuds HBM de 2026 sont déjà presque entièrement réservés, les lignes de V-NAND de prochaine génération sont déjà engagées avant leur lancement, et des contrats qui couvraient auparavant un trimestre couvrent désormais plusieurs années. Ce qui n’est pas destiné à du HBM est réorienté vers du NAND QLC pour des arrays d’entreprise, laissant moins de fonds pour la DRAM classique et le TLC de consommation.
L’effet domino se fait sentir jusqu’à l’utilisateur final. Par exemple, en octobre 2025, la Raspberry Pi a annoncé une hausse de 5 à 10 dollars sur ses modèles de 4 Go / 8 Go, en raison de l’augmentation des coûts de mémoire, admettant que le prix par puce dépasse désormais de près de 120 % celui de l’année précédente. C’est la pointe visible d’une hausse plus large qui ne laisse pas indemne la communauté des makers.
Pourquoi les fabricants ne construisent-ils pas plus de fabs ?
Des investissements pour construire de nouvelles lignes existent, mais ils ne sont ni rapides ni bon marché. Une fab de mémoire en greenfield coûte des dizaines de milliards d’euros et met des années à atteindre une capacité significative. Même pour augmenter la capacité de lignes existantes, il faut compter des mois d’installation et de calibration, dans un contexte où des acteurs comme ASML, Applied Materials et autres fournisseurs ont déjà des carnets bien remplis et des goulots d’étranglement.
De plus, les fabricants ont compris qu’une surinvestissement lors de pics de demande conduit souvent à des failles de prix (comme en 2019 ou 2022). Ils privilégient maintenant une approche plus disciplinée : vendre moins mais avec une meilleure marge, plutôt que d’ouvrir le robinet à tout va et de répéter le cycle de crise. La priorité est dorénavant où se trouve la marge : en HBM et dans les nœuds de nouvelle génération. Chaque disque de wafer dédié à l’HBM représente une moins bonne allocation pour la DRAM classique ; chaque ingénieur dévoué au QLC pour les entreprises est un ingénieur en moins pour le TLC de consommation.
À cela s’ajoutent des facteurs géopolitiques : contrôles à l’exportation sur la lithographie et les terres rares (imants au néodyme critiques pour les HDD), des restrictions croisées entre grandes puissances, et une pénurie de main d’œuvre spécialisée. Le puzzle est complexe, et ne se résout pas avec une solution simple : “construisons plus”.
À quoi s’attendre par catégorie
DRAM (DDR4, DDR5, HBM)
- DDR4 : disparition plus rapide que la baisse de la demande ; pénurie dans le PC et le serveur ; des hausses trimestrielles d’environ 30–40 % selon le marché référent.
- DDR5 : monte plus doucement, mais avec une tendance ascendante favorisée par une généralisation accrue.
- HBM : tout vendu chez de nombreux fabricants jusqu’à 2026 ; focus prioritaire d’investissement (capex).
NAND (TLC, QLC, entreprise)
- TLC grand public : rationnement ; forte hausse depuis les minimums de 2023.
- QLC pour l’entreprise : accélération dans le déploiement pour soulager le nearline ; pression accrue sur la supply.
- V-NAND de prochaine génération : pré-attribuée aux clients enterprise/hyperscale.
HDD (nearline et bulk)
- Nearline : délais qui dépasseront 12 mois pour certaines capacités >20 To ; augmentation de 5–10 % déjà annoncée par les fabricants.
- Sont utilisées en remplacement du QLC dans certaines charges : soulage un goulot d’étranglement… mais en crée un autre ( NAND).
Combien de temps cela peut-il durer ?
Les prudents évoquent plusieurs années de tension, pendant que d’autres affichent une prévision plus extrême de une décennie de resistance. La vérité est probablement quelque part entre les deux et dépend de trois vecteurs :
- Le rythme réel de l’IA : si la demande reste exponentielle (entraîner plus de modèles, faire des inférences partout), l’absorption restera élevée. Mais si des pauses interviennent après des périodes de stockpiling ou grâce à des améliorations en efficacité (meilleur usage par paramètre, sparsity, in-memory compute), le rythme pourrait diminuer.
- La capacité de production des fabs : le volume additionnel de HBM/DRAM et NAND prévu pour 2026–2027 ; leur arrivée à temps ou pas.
- Les enjeux géopolitiques et la supply chain : contrôle des équipements, des matériaux, des terres rares, des subventions, et de la main d’œuvre spécialisée.
Dans tous les cas, 2025-2026 semble s’annoncer comme une période de prix élevés et de priorité pour le secteur professionnel. Le consommateur, lui, restera en dernière position : moins d’offres, des capacités plus limitées.
Implications concrètes (selon votre profil)
Consommateurs et assembleurs PC
- SSD : Les bonnes affaires à 1-2 To à prix cassé ne reviendront pas de si tôt. Si vous avez besoin d’agrandir, faites-le quand ils sont encore disponibles à un prix raisonnable.
- RAM : La DDR4 va continuer à augmenter plus vite que la DDR5. Si vous utilisez encore du DDR4, il est judicieux de finaliser votre achat rapidement.
- Stratégie : privilégiez la capacité à la vitesse marginale; comparez 2×16 Go contre 2×8 Go, et 2 To TLC contre 1 To haut de gamme.
PME et secteur moyen de gamme
- Planification : il faut prévoir sur des dizaines de mois ; les prévisions trimestrielles ne suffisent plus.
- Capex : allouez un budget supplémentaire pour la mémoire et le stockage ; privilégiez des contrats annuels avec un eschalonage des livraisons.
- Architecture : combinez nearline et QLC lorsque la latence le permet ; étudiez des stratégies de compression/dédoupage et de tiering plus agressives.
Hyperscale et grandes entreprises
- Prénégociation de contrats pluriannuels directement avec fabricants (pas seulement distributeurs).
- Maintien d’chaînes d’approvisionnement duales et fournisseurs secondaires (lorsqu’ils existent).
- Optimisation : maximisez le moviment de datasets, le caching, le format (ex.: parquet, zstd) et surveillez attentivement l’utilisation réelle de l’HBM/DRAM en fonction des workloads.
Trois idées pour atténuer l’impact
- Acheter intelligemment : privilégiez le TLC avec un dwdp élevé et des contrôleurs éprouvés pour la production ; utilisez le QLC pour les lectures intensives et basses cycles d’écriture. Fuyez les faux économies sur des marques ou séries peu fiables.
- Architectures hybrides : tout ne doit pas résider en NVMe. Maintenez des couches (mémoire → NVMe → QLC → nearline), avec des politiques de migration et d’expiration des données.
- Optimisation IA : avant d’investir davantage dans le hardware, adoptez des techniques d’efficience (quantification, LoRA, sparsity, chargement intelligent en shards, batching des inférences). Réduire la mémoire par requête est une stratégie en or dans ce cycle.
La normalité reviendra-t-elle ?
Le marché de la mémoire et du stockage est cyclique. De nouvelles fabs sortiront de terre, certains projets échoueront, et le cycle d’oscillations continuera. Cependant, le seuil de prix pourrait bien rester plus élevé qu’en 2023 pour trois raisons principales :
- La demande structurelle en IA (formation, inférences, analyses),
- La discipline en capex apprise par les fabricants (leçons tirées)
- Les coûts croissants en équipements et main d’œuvre dans les nouvelles géographies
En attendant, la devise est planifier, diversifier et maximiser l’efficacité. La mémoire et la flash sont redevenues des actifs rares. Et lorsque le pétrole monte, tout ce qui en dépend le ressent : serveurs, chambres, GPU pods, PCs… et, oui, ces SSD 2 To qu’on ne reverra probablement pas à 80 € de sitôt.
Source : tomshardware