La fièvre de l’IA stimule la fonte : NVIDIA négocie avec TSMC une avancée de 50 % en 3 nm pour sa prochaine génération « Rubin »

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

La demande en puces pour l’intelligence artificielle ne fléchit pas et commence à avoir des effets visibles en première ligne de production. Selon des avant-premières de presse à Taïwan, TSMC prépare une augmentation spectaculaire de sa capacité en technologie 3 nm (N3) pour répondre, en grande partie, aux commandes de NVIDIA pour sa prochaine plateforme d’IA, connue en interne sous le nom de Vera Rubin. Ce mouvement intervient alors que la génération actuelle de Blackwell Ultra accélère son déploiement, et que les grands clients du calcul exigent davantage d’approvisionnement.

Les informations évoquent une image claire : N3 devrait passer d’environ 100 000 disques par mois à près de 160 000 dans l’usine de Tainan (Southern Taiwan Science Park), ce qui représente une augmentation de 45–50 %. Une partie significative — on parle même de « une grande part exclusive » — serait réservée à NVIDIA, qui aurait sécurisé des quotas avec plusieurs mois d’avance pour éviter le même goulot d’étranglement qui a marqué l’industrie depuis 2023. Jensen Huang, PDG de NVIDIA, a lui-même voyagé récemment à Taïwan pour visiter l’usine en 3 nm et rencontrer la direction de TSMC.

Pourquoi le 3 nm (N3P) devient le nouveau champ de bataille

« Rubin » ne représente pas une simple mise à jour mineure. La feuille de route vise à des améliorations transversales d’architecture et à une transition vers le N3P — la version peaufinée du processus en 3 nm de TSMC, dans le but d’augmenter la densité, l’efficacité énergétique et les fréquences. La plateforme est également liée à l’arrivée de HBM4, la prochaine génération de mémoire à haut débit qui doit continuer à booster les performances d’entraînement et d’inférence dans les centres de données. Ensemble, ces évolutions promettent plus de calcul par watt et une capacité mémoire accrue, deux variables aujourd’hui essentielles pour les fermes d’IA.

Le fait que NVIDIA reserve déjà des wafers correspond à un pattern récurrent tout au long de la chaîne : les principaux fournisseurs se alentangent face à une année 2026 qui s’annonce intensive en IA agentive, service à grande échelle et entraînements multi-clusters. Chaque trimestre, TSMC consolide son rôle de moteur en HPC/IA, et N3 sera sa colonne vertébrale pour plusieurs trimestres, en attendant la transition vers A16 (≈1,6 nm) vers la fin de la décennie.

Le chiffre qui explique l’urgence : 35 000 wafers/mois réservés à NVIDIA

Les détails circulant dans la presse locale indiquent que l’extension du site Tainan 18B passerait d’environ 10–11 wafers par démarrage (×10 000) à 16 wafers, et qu’au sein de cette capacité, NVIDIA disposerait d’environ 35 000 wafers par mois pour ses puces IA en 3 nm. Ce volume coexisterait avec le dernier-ditch de Blackwell Ultra et la préparation de Vera Rubin pour mi/fins 2026, un calendrier aligné avec les stratégies des hyperscalers pour renouveler leurs clusters et leur transition vers HBM4.

Si cette répartition se confirme, le mix de TSMC à 3 nm serait encore plus orienté vers HPC/IA, reléguant en priorité les clients mobiles et PC, qui, depuis 2023, se battent déjà pour obtenir des slots en N3 et N4. Ce n’est pas une anomalie : c’est la nouvelle norme. Les revenus par wafer dans le secteur HPC surpassent presque tous les autres segments, et le moyen de gamme pour un accélérateur IA est souvent lié à des contrats pluriannuels de centaines ou milliers de millions.

Le défi de l’empaquetage, autre goulot d’étranglement (impossible à ignorer)

Au-delà du processus, le packaging avancé continue de limiter la cadence. Des technologies telles que CoWoS, InFO ou leurs évolutions pour le HBM4 ont été le véritable obstacle à la montée en régime IA en 2023–2024. Augmenter le nombre de wafers démarrés reste nécessaire, mais insuffisant : il faut également augmenter la capacité de tests, d’assemblage et de substrats. La bonne nouvelle pour NVIDIA est que TSMC a déjà élargi ses installations et son écosystème OSAT ; la moins bonne, c’est que la disponibilité p99 dépend encore du packaging, lorsque tous les acteurs réclament la même capacité.

Ce que cela signifie pour le reste du marché

Pour TSMC : N3 renforcera sa part dans le chiffre d’affaires sur plusieurs trimestres. La société consolide son rôle de partenaire systémique de l’IA : sans sa montée en gamme en 3 nm (et sans l’optimisation de l’empaquetage), l’économie des tokens ne pourrait pas prendre son essor.
Pour Samsung Foundry et Intel Foundry : la course ne s’arrête pas, mais le mouvement rétrécit la marge. À court terme, la meilleure option pour capter une partie des commandes NVIDIA reste l’empaquetage et les nœuds complémentaires; dans le cas d’un nœud leader, l’inertie favorise TSMC.
Pour les hyper-scalers : réserver des capacités avant 2026 sera la différence entre lancement et retard. Ceux qui n’auront pas sécurisé de wafers ou de HBM4 devront ajuster leurs planifications ou leurs architectures.
Pour la concurrence en IA : si Rubin tient ses promesses, la fenêtre pour combler le retard face à NVIDIA se resserre. La stratégie de rattrapage dépend autant du logiciel (compilateurs, runtimes, bibliothèques) que du silicium.

Pourquoi Jensen est à Taïwan (et pourquoi ce n’est pas qu’une photo)

Au-delà du symbole — participer à l’événement interne de TSMC et se faire photographier avec la direction —, la visite a une véritable agenda : capacité, délais et priorités. NVIDIA est aujourd’hui le client principal de TSMC dans le domaine HPC, et a besoin de visibilité pour aligner sa feuille de route avec des contrats multimillionnaires avec des hyper-scalers déjà en mode multi-nuage et multianual. Le message de Huang, lors de son passage sur l’île, était clair : les affaires sont « très solides » mois après mois, et Taïwan est essentiel pour maintenir cette dynamique.

Le risque à ne pas perdre de vue : énergie et coûts

La montée en gamme en 3 nm ne peut tenir sans mégawatts. Taïwan, les États-Unis et l’Europe font face à une augmentation simultanée de la demande électrique pour leurs centres de données et fabs. Sous-estimer cette équation énergétique a été l’erreur de 2023 en cloud ; la reproduire dans le secteur manufacturier serait encore pire. Si le prix par watt augmente ou si l’offre est mise à rude épreuve, cela entraînera des décalages dans les délais et une augmentation du capex. TSMC a adopté une approche prudente dans son expansion, mais la démarche exigeante de l’IA impose de planifier sur plusieurs années.

Quand verrons-nous Rubin sur des machines réelles ?

Les délais des fonderies laissent entrevoir des échantillons (early silicon) dès la première moitié de 2026, avec une production espérée pour la fin 2026 et des déploiements visibles en 2027. En attendant, Blackwell Ultra poursuivra sa route, avec des extensions de clusters déjà programmées pour 2025–2026. Les hyper-scalers les plus ambitieux joueront en >>>> en superposant leurs efforts : ils étendre la production de Blackwell tout en préparant l’arrivée de Rubin.

Les clés pour comprendre en 60 secondes

TSMC prévoit d’augmenter sa capacité en 3 nm d’environ 50 % (de ~100 000 à ~160 000 wafers par mois) à Tainan, principalement pour répondre à NVIDIA.
NVIDIA aurait réservé environ 35 000 wafers par mois en N3P pour sa prochaine génération « Vera Rubin », qui combinera nœud 3 nm et HBM4.
La véritable contrainte demeure dans l’empaquetage avancé : CoWoS et ses successeurs déterminent le p99 de disponibilité.
Calendrier probable : Rubin en 2026 ; Blackwell Ultra prolonge son cycle tout au long de 2025 et une partie de 2026.