Le goulet d’étranglement de TSMC remet en question la transition totale de NVIDIA vers A16

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

La prochaine grande architecture de NVIDIA pour centres de données, Feynman, commence déjà à donner une leçon avant même son lancement : à l’ère de l’intelligence artificielle, il ne suffit pas de concevoir la puce la plus ambitieuse ; il faut également disposer de capacités suffisantes pour la fabriquer. Ces dernières heures, une rumeur en provenance d’Asie circule fortement selon laquelle le manque de capacité sur le procédé A16 de TSMC obligerait NVIDIA à reconsidérer une partie du design de ses futures GPU, prévues pour 2028. Aucune confirmation officielle ni de NVIDIA ni de TSMC n’a été communiqué à ce sujet, il convient donc de le traiter comme ce qu’il est : une information provenant d’une chaîne d’approvisionnement, pertinente mais non vérifiée publiquement pour l’instant.

Ce qui est cependant confirmé, c’est le contexte qui rend cette hypothèse crédible. TSMC a présenté A16 comme un procédé spécifiquement conçu pour les produits HPC et l’intelligence artificielle, avec des transistors nanosheets et la technologie Super Power Rail. La société affirme que sa production en volume débutera en deuxième moitié de 2026. Par rapport à N2P, TSMC promet pour A16 une augmentation de vitesse entre 8 % et 10 % à consommation équivalente, une réduction de consommation énergétique de 15 % à 20 % pour des performances identiques et une densité accrue de 7 % à 10 %. Sur le papier, c’est exactement le type de nœud qui correspond à une génération telle que Feynman, que NVIDIA a d’ailleurs déjà inscrite officiellement dans sa feuille de route pour 2028.

Le problème, c’est que le papier peut tout supporter, mais pas la capacité de production. En janvier, TSMC reconnaissait lors de sa conférence de résultats que la demande pour des semiconducteurs avancés liés à l’IA restait très forte, que ses principaux clients maintenaient des prévisions optimistes, et que même les clients de ses clients — principalement les grands fournisseurs de cloud — sollicitaient directement plus de capacité. Cette pression ne se limite pas à un seul procédé ni à un seul client. Le 24 mars 2026, Reuters rapportait que Broadcom percevait également la capacité de TSMC comme un goulot d’étranglement, et que la fonderie taiwanaise rencontrait des limites de production face à la croissance exponentielle de la demande en chips pour IA.

Une rumeur plausible, mais non confirmée

La piste évoquant un changement dans Feynman provient d’informations et de bruits en provenance de la chaîne d’approvisionnement asiatique, selon lesquelles NVIDIA aurait initialement prévu cette famille de GPU basé sur A16, mais aurait maintenant besoin d’associer ce nœud à N3P pour certains composants moins critiques. Selon ces sources, les die ou chiplets les plus sensibles resteraient en A16, tandis que d’autres parties migreraient vers un procédé plus mature et mieux disponible. Cette information n’a pas encore été confirmée par les entreprises concernées, et ce détail est essentiel. En microélectronique, une différence entre “objectif de conception”, “prototypage” et “produit final” peut totalement influencer la lecture et la stratégie.

Cependant, cette hypothèse n’est pas dénuée de fondement. TSMC a clairement indiqué que A16 n’est pas un procédé généraliste, mais une technologie dédiée à certains chips de très haute performance, avec des exigences complexes en termes de gestion de signal et d’alimentation. Plus un nœud est spécifique et avancé, plus sa montée en volume est difficile. De plus, l’industrie voit depuis plusieurs mois comment l’IA pousse à ses limites non seulement les wafers avancés, mais aussi l’emballage, la mémoire HBM, les interposers, les lasers, et même certains segments moins visibles de la chaîne d’approvisionnement. Si une entreprise comme Broadcom évoque déjà des restrictions chez TSMC, il ne serait pas surprenant que NVIDIA doive également ajuster ses calendriers, ses choix de nœuds ou la répartition interne de ses blocs pour ses futures générations.

Ce qui est en jeu pour NVIDIA

Plus qu’un simple bruit, ce qui importe, c’est ce que cela révèle sur le marché. NVIDIA continue de dominer l’infrastructure de l’IA, mais cette domination ne garantit pas un accès illimité au procédé le plus avancé du plus grand fabricant mondial. Ceci a plusieurs implications. La première est technique : si Feynman devait combiner plusieurs nœuds, NVIDIA devrait optimiser davantage la répartition entre blocs logiques, mémoire et interconnexion pour ne pas compromettre efficacité, performance ou consommation. La seconde est industrielle : l’avantage concurrentiel dans l’IA ne dépend plus seulement de l’architecture, du logiciel ou de l’écosystème, mais aussi de la capacité à assurer un approvisionnement fiable sur plusieurs années.

La troisième implication, plus large, concerne le reste du secteur. Si TSMC doit surveiller de près la capacité à produire en A16 pour ses clients de premier ordre, la marge pour les acteurs plus petits sera encore plus étroite. Cela renforce une tendance déjà visible : des contrats plus longs, une planification plus agressive et une diversification partielle lorsque cela est possible. En somme, l’ère de l’IA n’a pas seulement multiplié la demande en puissance de calcul ; elle a aussi transformé la capacité de production avancée en un actif stratégique rare.

Pour l’instant, la prudence demeure de mise. NVIDIA a confirmé que Feynman restera dans sa génération de 2028 et TSMC maintient que A16 entrera en production au second semestre de 2026. Le reste — si Feynman intégrera entièrement A16, si le design sera combiné avec N3P ou s’il devra être ajusté pour pallier un manque de capacité — reste pour l’heure dans le domaine de la spéculation industrielle. Mais le message de fond est clair : la prochaine étape de la course à l’IA ne se joue pas seulement dans les laboratoires de conception, mais aussi dans la capacité à transformer ces designs en wafers réels, dans des délais et à volume suffisants.