Google regarde Intel Foundry pour renforcer la production de ses TPU

Google regarde Intel Foundry pour renforcer la production de ses TPU

Google aurait confié à Intel Foundry la fabrication de plus de trois millions de TPU, ses accélérateurs propriétaires pour l’intelligence artificielle, avec une livraison prévue pour 2028. Bien que cette opération n’ait pas été confirmée publiquement par les entreprises, sa réalisation dans ces termes représenterait l’un des plus importants soutiens externes à la stratégie de fonderie d’Intel et enverrait un message clair sur l’évolution de l’infrastructure IA : davantage de capacité, plus de fournisseurs et une dépendance réduite à une seule chaîne de fabrication.

Ce mouvement ne doit pas être interprété comme une rupture avec TSMC, mais plutôt comme une démarche de diversification. La demande en puces pour l’IA continue de croître à un rythme difficile à absorber même pour les leaders actuels de la fabrication avancée. Pour Google, assurer une capacité additionnelle pour les futures générations de TPU consiste à protéger une partie essentielle de ses activités : Gemini, Google Cloud, ainsi que des applications comme Search, Photos ou Maps, toutes directement liées à ses accélérateurs propriétaires.

Les TPU sont devenues un enjeu stratégique pour Google

Les TPU, Tensor Processing Units, sont des ASIC conçus par Google pour accélérer les charges de travail d’apprentissage automatique. La société les utilise depuis plusieurs années dans des modèles fondamentaux, l’inférence, l’entraînement, la recommandation, la génération de code, la vision, la synthèse vocale et la personnalisation. Google Cloud présente ces accélérateurs comme optimisés pour les agents, les grands modèles de langage et les applications d’IA à grande échelle.

La dernière génération officiellement annoncée par Google, TPU 8t et TPU 8i, illustre bien l’ampleur du défi. La TPU 8t est destinée à l’entraînement de modèles à grande échelle, tandis que la TPU 8i vise l’inférence à faibles latences pour des charges agéntiques. Google affirme que la TPU 8t permet la création de superpods de 9 600 puces, disposant de deux pétaoctets de mémoire HBM partagée et de 121 ExaFLOPS de puissance de calcul, alors que la TPU 8i intègre 288 GB de mémoire à haute bande passante, 384 Mo de SRAM interne et une interconnexion ICI de 19,2 Tb/s.

Élément Ce que cela signifie pour Google
TPU propriétaires Moins de dépendance directe vis-à-vis des GPU de tiers
TPU 8t Entraînement de modèles de grande taille et développement de modèles fondamentaux
TPU 8i Inférence à faibles latences pour agents et services en production
Google AI Hypercomputer Pile intégrée de matériel, réseau, stockage, logiciel et orchestration
Intel Foundry en tant que fabricant potentiel Capacité supplémentaire et diversification des sources d’approvisionnement
TSMC reste un acteur central de la fabrication avancée
Livraison prévue en 2028 Horizon lié aux futures générations d’infrastructure IA

La distinction entre TPU 8t et TPU 8i est également importante. Google conçoit ces puces spécialisées car entraîner des modèles et fournir des inférences à grande échelle ne relève plus du même défi technique. La formation demande une capacité de traitement, une mémoire partagée et une interconnexion massive. L’inférence, quant à elle, nécessite une faible latence, un large bande passante mémoire et une efficacité coût. Dans une ère où les agents raisonnent, planifient, exécutent, et réapprennent en boucle continue, même de faibles inefficacités se multiplient lorsque des millions de requêtes sont traitées.

Pourquoi Intel a besoin d’un client comme Google

Pour Intel Foundry, un tel contrat aurait une valeur qui dépasse le simple revenu. La société tente depuis des années de convaincre le marché qu’elle peut concurrencer comme fonderie avancée pour des clients externes, pas seulement comme fabricant de ses propres processeurs. Cette transition nécessite une technologie de pointe, des capacités industrielles, un écosystème de conception, un emballage avancé et, surtout, des clients de référence.

Intel 18A constitue le cœur de cette stratégie. La société le présente comme un nœud de 2 nm en classe mondiale, développé et fabriqué en Amérique du Nord, intégrant RibbonFET, sa technologie de transistors gate-all-around, et PowerVia, son architecture d’alimentation arrière. Intel soutient que le 18A est destiné à des applications comme HPC, IA, processeurs mobiles, radiofréquences, imaging et défense.

La variante Intel 18A-PT est particulièrement intéressante pour les accélérateurs IA complexes. Intel la décrit comme une option pensée pour les clients en IA et HPC avec des conceptions 3DIC, TSV, die-to-die TSV et connectivité par hybrid bonding. Selon la documentation d’Intel, le 18A-PT permet une intégration avancée pour les charges de travail haute performance et les configurations multi-die.

Le packaging joue aussi un rôle avec l’intégration. Intel Foundry souligne que le 18A-PT peut se connecter à des dies supérieurs via Foveros Direct 3D avec une interconnexion hybride de moins de 5 micromètres. Cette capacité revêt une importance cruciale car les accélérateurs IA deviennent des systèmes complexes formés de chiplets, mémoire haute bande passante, interposers, réseaux internes et technologies de jonction de plus en plus denses.

Diversifier ne signifie pas abandonner TSMC

Le potentiel contrat de Google avec Intel s’inscrit dans une stratégie de résilience de l’approvisionnement. TSMC demeure le leader incontesté de la fabrication avancée et reste un acteur clé pour des entreprises comme NVIDIA, Apple, AMD, Qualcomm et bien d’autres. Mais la concentration de la demande autour de TSMC est devenue une variable de risque opérationnel et géopolitique pour les grands acheteurs de capacité.

L’intelligence artificielle a mis à rude épreuve tous les segments de la chaîne : wafers avancés, HBM, empaquetage CoWoS, interconnexion, substrates, énergie, centres de données et capacité d’intégration. Dans ce contexte, un second fournisseur ne remplace pas nécessairement le premier, mais le complète. Pour Alphabet, disposer d’une part de sa production future chez Intel pourrait lui offrir plus de marge face à d’éventuels goulets d’étranglement, retards ou modifications de priorités industrielles.

Ce raisonnement est similaire à celui observé dans d’autres segments de la chaîne des semi-conducteurs. Les concepteurs de puces recherchent davantage d’options de fonderie, de capacité régionale et de solutions d’emballage. Ce n’est pas parce que TSMC n’est plus fiable, mais parce que l’ampleur de l’IA impose une planification avec une redondance industrielle.

Pour Intel, Google représenterait un client particulièrement précieux car les TPU constituent une charge réelle de hyper-échelle. Il ne s’agit pas d’un chip expérimental, mais d’accélérateurs alimentant des services mondiaux d’IA. Une commande de millions d’unités prouverait qu’Intel Foundry est apte à fabriquer du silicium critique pour l’un des plus grands opérateurs mondiaux de l’infrastructure.

NVIDIA aussi scrute l’intégration avancée

Les informations concernant Google s’accompagnent d’un autre indice précieux : NVIDIA étudierait aussi si la technologie d’Intel pourrait servir à fabriquer un processeur combinant quatre GPU dans une seule unité. Aucune commande officielle ni confirmation n’a été annoncée, mais cette orientation technique s’aligne avec l’évolution du marché.

Les accélérateurs IA évoluent vers des architectures multi-die. La densité d’interconnexion, la latence entre chiplets, l’alimentation, la refroidissement et l’intégration mémoire sont aussi critiques que le nœud de fabrication. Intel cherche à se positionner justement à ce niveau : pas seulement comme fonderie de transistors, mais comme fournisseur de systèmes de fabrication et d’emballage avancés.

Ce point peut faire toute la différence. La race à l’IA ne se gagne pas uniquement par le nœud de processeur le plus petit, mais par la capacité à monter des systèmes complets offrant de bonnes performances par watt, une évolutivité efficace et une capacité de production suffisante. Google le met en pratique avec son propre processus de co-conception : TPU, Axion comme CPU hôte, réseau, refroidissement liquide, stockage, frameworks comme JAX ou PyTorch et accès direct au matériel constituent une même architecture intégrée.

La comparaison avec NVIDIA est inévitable, mais pas totalement équivalente. Google conçoit ses TPU pour ses propres services cloud et ses propres applications, tout en les proposant aussi à ses clients Google Cloud. NVIDIA propose une plateforme beaucoup plus large et transversale au marché. Intel, de son côté, cherche à devenir un fournisseur de fabrication pour ces deux types de clients : ceux qui conçoivent leurs propres puces et ceux qui ont besoin d’un emballage avancé pour des systèmes d’IA de plus en plus complexes.

Une étape potentielle pour Intel Foundry

Intel doit prouver que son orientation vers la fonderie peut attirer de grands clients externes. L’investissement dans les usines, les nœuds avancés et l’emballage est colossal, et le marché ne se satisfait pas uniquement d’annonces. Il attend des commandes concrètes, des tape-outs, de la production, du rendement, du volume.

Un partenariat avec Google pour fabriquer des TPU serait une validation très forte. Cela enverrait également un signal à d’autres concepteurs de puces : Intel Foundry peut être une option viable pour diversifier la production en Amérique du Nord, notamment dans les domaines liés à l’IA et au HPC. Ce message arrive à un moment où les États-Unis et l’Europe cherchent à renforcer leur capacité en semiconducteurs pour des raisons économiques, technologiques et stratégiques.

Il faut toutefois rester prudent. La fabrication de plus de trois millions d’accélérateurs IA n’est pas qu’une question de capacité réservée, mais requiert la maturité du nœud, une production fiable, un emballage adéquat, un approvisionnement en mémoire, une validation rigoureuse, du logiciel, une logistique efficace et une coordination avec les centres de données. Jusqu’à ce que Google ou Intel confirment officiellement, cette information doit être considérée comme non officielle, bien que cohérente avec la stratégie technique et industrielle du marché.

Ce qui est clair, c’est le contexte : Google a besoin de davantage de TPU pour l’ère agentique, Intel doit attirer des clients externes à grande échelle, et toute l’industrie doit accroître la capacité de fabrication avancée en dehors des goulots d’étranglement traditionnels. Si ces trois besoins convergent, Intel Foundry pourrait saisir dans la production de TPU Google une opportunité qu’elle recherchait depuis des années.


Questions fréquentes

Que sont les TPU de Google ?

Les TPU sont des accélérateurs customisés conçus par Google pour des charges d’IA telles que l’entraînement, l’inférence, les agents, la génération de code, la vision, la voix, la recommandation et la personnalisation.

Quelle est la différence entre TPU 8t et TPU 8i ?

La TPU 8t est orientée vers l’entraînement de modèles à grande échelle, tandis que la TPU 8i est conçue pour l’inférence à faible latence et les charges en production.

Pourquoi Google solliciterait-il Intel Foundry ?

Pour diversifier la capacité de fabrication, réduire la dépendance à une seule chaîne d’approvisionnement et assurer une production supplémentaire pour les futures générations de TPU.

Que propose Intel 18A dans ce marché ?

Intel 18A intègre RibbonFET et PowerVia, et la variante 18A-PT est destinée aux designs IA et HPC avec TSV, bonding hybride et emballage avancé 3DIC.

le dernier