MediaTek exploite son travail sur la TPU v7 de Google pour maximiser l’efficacité du Dimensity 9600

Google présente Ironwood : son TPU pour dominer l'inférence des modèles de raisonnement à l'ère exascale

La septième génération d’accélérateurs d’intelligence artificielle de Google porte un nom et un silicium : TPU v7 Ironwood. Conçue pour rivaliser directement avec les GPU Blackwell de NVIDIA dans les charges d’inférence à grande échelle, cette nouvelle famille de puces constitue non seulement un mouvement stratégique pour Google Cloud, mais aussi une opportunité lucrative pour MediaTek. Ce dernier a collaboré à la conception et cherche désormais à exploiter cet apprentissage dans son futur SoC mobile haut de gamme, le Dimensity 9600.


Ironwood : la TPU que Google veut défier à NVIDIA

Ironwood représente la septième génération de TPU de Google, conçue pour l’entraînement et l’inférence de modèles volumineux, qu’ils soient denses ou de type Mixture-of-Experts. Chaque puce TPU7x comporte :

  • Deux TensorCores pour le calcul matriciel (incluant FP8)
  • Quatre SparseCores, optimisés pour traiter des structures dispersées comme embeddings, très courantes dans les modèles de langage
  • 192 GiB de mémoire HBM3E par puce, avec un débit proche de 7,4 TB/s

L’architecture adopte un design dual-chiplet: chaque composant physique se divise en deux « dispositifs » logiques, chacun avec son propre TensorCore, SparseCores et 96 GiB de HBM. Ces deux moitiés communiquent via un lien die-to-die jusqu’à 6 fois plus rapide que les interconnexions traditionnelles entre puces (ICI).

Au niveau du système, Google optimise ces puces jusqu’à des configurations extrêmes :

  • 64 puces forment un « cube » TPU, interconnectées avec 1,2 To/s de bande passante bidirectionnelle par puce
  • Plusieurs cubes connectés via un réseau Optical Circuit Switching (OCS) pour créer un superpod de 9 216 puces, avec quelque 42,5 exaFLOPS FP8 et 1,77 PB de HBM partagée

Grâce à ces chiffres, Ironwood réduit considérablement l’écart en termes de calcul, mémoire et bande passante par rapport à la plateforme GB200/GB300 de NVIDIA, tout en privilégiant une approche très agressive en efficacité énergétique et coût total de possession (TCO) pour l’inférence, segment en forte croissance dans le cloud.


Le rôle de MediaTek : de l’I/O d’Ironwood à la conception des SoC mobiles

Ce qui est particulièrement intéressant pour l’industrie mobile dans cette histoire, c’est la contribution de MediaTek dans le développement de cette « bête ». Contrairement aux générations précédentes où Broadcom était le partenaire clé pour le design, plusieurs rapports indiquent que Google a fait appel à MediaTek pour concevoir les modules d’entrée/sortie (I/O) d’Ironwood, responsables de la communication de la puce avec le reste du système.

Cela soulève plusieurs lectures :

  • Changement de partenaire stratégique : Google diversifie sa dépendance à Broadcom et s’appuie sur un fournisseur expérimenté en SoC de consommation, où le rapport performance/consommation est critique.
  • Connaissances réutilisables : bien qu’une TPU de centre de données et un SoC mobile aient des architectures très différentes, le design d’I/O haute vitesse, la gestion de l’énergie et le packaging avancé partagent des problématiques sous-jacentes communes.
  • Impact économique direct : selon UBS, MediaTek pourrait générer environ 4 milliards de dollars grâce à sa collaboration avec Google dans cette septième génération de TPUs.

Pour MediaTek, ce partenariat ne se limite pas à une nouvelle activité dans l’IA pour datacenters, mais constitue aussi une plateforme d’expérimentation de premier ordre pour améliorer l’efficacité de ses futurs chipsets mobiles. La société adopte en effet des stratégies très agressives en matière de performance.


Dimensity 9600 : un flagship qui exige chaque milliwatt d’efficience

Le Dimensity 9600 sera le prochain fleuron de MediaTek pour smartphones 5G haut de gamme. Selon les fuites, il sera lancé en 2026, fabriqué dans l’un des procédés les plus avancés de TSMC, avec un niveau de performance situé entre le Snapdragon 8 Elite Gen 6 « classique » et la version Pro de Qualcomm.

Par ailleurs, la société a déjà adopté une stratégie risquée avec les Dimensity 9300 et 9500, en abandonnant les cœurs d’efficacité traditionnels au profit de configurations uniquement composées de cœurs gros (big cores), ce qui a alimenté le débat sur leur consommation réelle en usage prolongé.

Dans ce contexte, chaque gain en gestion d’énergie est précieux. Et c’est là que l’expertise acquise avec Ironwood entre en jeu :

  • Power gating plus poussé
    Concevoir l’I/O pour une TPU traitant des téraoctets par seconde de HBM oblige à optimiser la désactivation sélective des blocs lorsqu’ils ne sont pas utilisés. MediaTek pourra appliquer ces techniques dans le Dimensity 9600 pour désactiver contrôleurs, bus et périphériques de façon plus fine, réduisant ainsi la consommation en veille et lors d’utilisations légères.
  • Amélioration du voltage scaling
    Ironwood travaille avec des marges de tension très optimisées pour maximiser l’efficience en FP8 et BF16. Ajuster les algorithmes de régulation de tension dans le Dimensity 9600 — par exemple via des courbes DVFS plus fines — peut permettre au SoC de fonctionner plus longtemps dans des zones de « performance optimale ».

  • Refinement du clock-gating
    L’expérience de Turing en matière d’optimisation des chemins d’horloge dans une TPU haute densité peut être recyclée pour réduire le clock là où il n’apporte pas de gain perceptible. Sur un SoC mobile sans cœurs d’efficacité, pouvoir « couper » la fréquence de blocs entiers lorsqu’ils ne sont pas requis est essentiel pour préserver la batterie.

Selon Wccftech et d’autres sources, MediaTek ne pourra pas transférer directement tout ce qu’elle apprend avec Ironwood à un processeur mobile, étant donné les différences évidentes entre un ASIC de datacenter et un AP de smartphone. Néanmoins, la société aura sans doute la possibilité de réaliser des améliorations itératives susceptibles d’améliorer significativement l’autonomie par rapport à Qualcomm ou Apple.


L’IA dans le cloud et l’IA dans la poche : deux fronts, une même bataille

La collaboration entre Google et MediaTek reflète aussi comment s’organise la chaîne de valeur de l’IA :

  • Dans le cloud, Ironwood et les TPU de Google cherchent à baisser le coût par token inféré et augmenter le rendement par watt, dans le but de réduire la domination de NVIDIA dans les hyperscalers.
  • Dans l’appareil, les Dimensity et Snapdragon de nouvelle génération rivalisent pour exécuter des modèles génératifs et des assistants locaux avec un impact minimal sur la batterie et la température.

MediaTek joue désormais sur les deux tableaux. Son travail sur les modules d’I/O d’Ironwood la positionne en première ligne de la génération ultra-massive de l’IA dans les datacenters, tandis que le Dimensity 9600 sera la vitrine de la capacité à condenser cette expérience dans un chip rangé dans la poche.

Si cet élargissement de l’efficience se concrétise, le consommateur final ne verra pas « TPU v7 » indiqué sur son smartphone, mais pourrait ressentir une augmentation de l’autonomie, moins de throttling, et des capacités d’IA locale plus durables. Et dans un marché où tous vantent TOPS et NPU, la vraie différence pourrait encore une fois résider dans une notion aussi ancienne que l’ingénierie de l’efficience.

le dernier