Les ASIC gagnent du terrain dans l’IA : les GPU sous pression

Les ASIC accélèrent dans l'IA et menacent la domination absolue des GPU

Au cours des trois dernières années, la trajectoire de l’IA a été largement dominée par un mot : GPU. NVIDIA s’est imposée comme l’entreprise la plus influente du secteur, ses accélérateurs étant la solution la plus rapide et la plus accessible pour entraîner et déployer des modèles. Mais le marché commence à s’intéresser sérieusement à une autre famille de puces : les ASIC, des processeurs conçus sur mesure pour des charges spécifiques.

Johnny Shen, président d’Alchip Technologies, estime que les ASIC mettront encore du temps à dépasser les GPU en parts de marché globales, mais leur croissance pourrait s’accélérer dans les années à venir. Cette tendance s’inscrit dans une orientation de plus en plus marquée chez les grands fournisseurs de cloud : réduire leur dépendance aux puces standardisées et développer leur propre silicium, mieux adapté à leurs contraintes de coûts, de consommation, de performance et d’intégration.

Ce n’est pas une prédiction de disparition des GPU. Ils restent centraux pour l’entraînement de modèles, le développement d’IA et de nombreuses charges hybrides. Mais la prochaine phase du marché pourrait ne plus être dominée exclusivement par la puce la plus flexible, mais par celle offrant la meilleure efficacité pour une tâche précise. Sur ce point, les ASIC ont un avantage naturel.

Pourquoi les hyperscalaires s’orientent vers des puces sur mesure

Les GPU ont gagné parce qu’ils sont polyvalents. Ils conviennent à l’entraînement, l’inférence, la recherche, la simulation, la science des données et beaucoup de charges parallèles. Cette flexibilité a été essentielle durant une période d’évolution rapide de l’IA, quand personne ne voulait s’engager dans une architecture trop fermée.

Mais quand une charge se stabilise et s’exécute à grande échelle, l’équation change. Un hyperscaler qui sert des millions de requêtes d’inférence, entraîne ses propres modèles ou conçoit des services IA pour ses produits internes n’a pas toujours besoin de flexibilité maximale. Il cherche avant tout l’efficacité, le contrôle des coûts, un approvisionnement fiable et des performances par watt. Un ASIC peut être conçu exactement pour répondre à ces besoins.

Google utilise ses TPU depuis plusieurs années. Amazon déploie ses solutions Trainium et Inferentia. Microsoft travaille avec un silicium propriétaire et noue des partenariats avec des tiers. Meta a développé ses propres accélérateurs MTIA. Broadcom est devenu un partenaire clé pour la fabrication de puces sur mesure. Alchip occupe une position distincte : elle ne concurrence pas en tant que marque de GPU, mais comme fournisseur de design et de services de fabrication pour les entreprises souhaitant produire leurs propres ASIC à des nœuds avancés. De son côté, FuriosaAI et Broadcom préparent déjà une puce d’inférence à 2 nm qui illustre cette tendance.

Selon TrendForce, Alchip a indiqué lors de sa dernière conférence de résultats que la production en série d’un design pour un client important a commencé en mai, ce qui devrait stimuler la croissance de ses revenus cette année et la suivante. Un accélérateur IA en 3 nm destiné à un client nord-américain devrait représenter une part significative des livraisons dès le troisième trimestre, tandis que des projets en 2 nm avancent pour un tape-out vers la fin de l’année.

TechnologieAvantage principalLimitation
GPUFlexibilité, écosystème mature, large éventail logicielCoût élevé, consommation importante, dépendance fournisseur
ASICPerformance/watt, coûts optimisés, conception sur mesureMoins flexible, coût initial plus élevé
TPU / accélérateurs cloudIntégration verticale dans de grandes plateformesGénéralement liés à un fournisseur spécifique
Chiplets + 2.5D/3DICScalabilité accrue, meilleure intégration de nœudsComplexité accrue de conception, test et fabrication

Les pressions économiques sont réelles. D’après Alchip, les ASIC pourraient offrir un avantage en coût total de possession compris entre 40 % et 65 % par rapport à d’autres solutions dans le cadre de déploiements massifs sur plusieurs années. La société estime aussi que le marché des ASIC pour l’IA pourrait passer de 13 milliards de dollars en 2024 à plus de 150 milliards en 2030, avec un taux de croissance annuel proche de 50 %. Ces chiffres sont des estimations internes, mais ils traduisent l’appétit du marché.

L’IA devient une conception de système

Le changement n’est pas qu’économique. Les nouveaux accélérateurs IA ne peuvent plus être considérés comme une seule puce isolée. Leur performance dépend de la combinaison de compute dies, de mémoire HBM, d’interconnexions, de chiplets, d’alimentations, d’empaquetage avancé et de refroidissement.

Alchip insiste sur cette approche avec sa plateforme 3DIC. La conception de processeurs IA évolue vers une vision systémique : il ne suffit plus d’accumuler davantage de transistors sur un die. Il faut décider quelle partie sera fabriquée en nœud de pointe, quels blocs peuvent utiliser des nœuds plus matures, comment connecter les chiplets, comment alimenter le système et dissiper la chaleur.

Sa plateforme 3.5D divise de grands SoC en chiplets optimisés dans différentes technologies de nœud. Les dies de calcul peuvent être fabriqués en nœuds avancés, tandis que les fonctions d’entrée/sortie et la mémoire utilisent des nœuds plus économiques. L’architecture combine scalabilité horizontale avec découpage vertical sélectif, grâce à des technologies comme CoWoS-S, CoWoS-R, CoWoS-L et TSMC-SoIC-X.

L’objectif est d’atténuer les limitations des puces monolithiques. À mesure que la complexité des designs augmente, les problèmes liés à la limite de réticle, à la baisse de rendement, aux coûts de masques et à la consommation se multiplient. L’empaquetage avancé permet de construire des systèmes plus grands sans dépendre d’un seul die massif. Alchip affirme que sa plateforme offre une densité d’interconnexion jusqu’à 3 à 5 fois supérieure, une consommation par bit réduite de 30 % à 40 %, et une latence pouvant être jusqu’à 35 % inférieure. En IA, déplacer les données devient aussi crucial que les traiter.

La compétition se déplace vers TSMC et l’empaquetage avancé

L’émergence des ASIC ne supprime pas les goulots d’étranglement, elle les déplace. Si davantage d’hyperscalaires conçoivent leurs propres puces en 3 nm et 2 nm avec des technologies d’empaquetage avancé, la pression sur TSMC, CoWoS, les substrats, les OSAT, la mémoire HBM et les capacités de test s’intensifiera encore.

Johnny Shen a souligné que la capacité de production en 3 nm est extrêmement tendue et, selon lui, cette situation peut être plus préoccupante encore que la pénurie de mémoire. Pour Alchip, entretenir une relation étroite avec TSMC n’est pas une simple opération : c’est un enjeu stratégique central. Un bon design ne suffit pas si l’approvisionnement en wafers, les capacités d’empaquetage et la chaîne logistique ne suivent pas en production de masse.

En mars, Alchip a annoncé des avancées dans sa plateforme pour le design en 2 nm, avec plusieurs prototypes en cours, des tape-outs et des tests silicon réussis dès la première fabrication. Sa plateforme combine aussi des dies de calcul en 2 nm avec des chiplets I/O en 3 nm ou 5 nm, une approche pratique tant que les chiplets d’entrées/sorties en 2 nm ne seront pas encore disponibles.

Les puces ne seront plus simplement « une pièce » monolithique, mais un ensemble de blocs spécialisés intégrés dans un package complexe. La valeur ne résidera pas uniquement dans le design logique, mais dans la coordination physique, l’empaquetage, la gestion de la chaîne d’approvisionnement et la performance thermique.

Facteur cléImportance en ASIC IA
Nœud avancéAméliore la densité et l’efficacité des dies de calcul
ChipletsPermettent de combiner différents nœuds et réduisent le risque de puces trop volumineuses
HBMFournit la bande passante nécessaire pour entraînement et inférence
CoWoS / 3DICIntègre mémoire, calcul et interconnexion dans un package avancé
Production de masseDétermine si le design atteint le marché à temps avec un coût optimisé
LogicielsPeut limiter l’adoption si l’écosystème n’est pas mature

Un marché plus fragmenté, mais pas moins dominé

La montée en puissance des ASIC ne signifie pas que NVIDIA perd sa position du jour au lendemain. Sa force en logiciels, CUDA, bibliothèques, systèmes intégrés, réseaux, racks IA et relations clients reste considérable. Le GPU reste adapté à la recherche, aux charges évolutives et aux déploiements où la flexibilité prime sur l’efficacité pure.

Ce qui pourrait changer, c’est la composition de la croissance. Si l’entraînement de modèles de pointe reste concentré sur les GPU, mais que l’inférence à grande échelle migre partiellement vers des ASIC, le marché sera plus fragmenté : puces propres, designs semi-personnalisés et collaborations accrues entre hyperscalaires, fabricants d’ASIC, fondeurs et fournisseurs d’empaquetage. C’est ce qu’illustre d’ailleurs la stratégie d’NVIDIA avec ses usines d’IA, qui cherche à rester incontournable même dans un monde plus fragmenté.

GUC, autre acteur taïwanais, défend une thèse similaire : quand l’IA passe de l’entraînement aux applications finales, les ASIC offrent une efficacité par watt bien supérieure aux GPU généralistes. MediaTek a revu à la hausse ses prévisions pour ses revenus liés à l’IA ASIC, doublant son estimation, de 1 milliard à 2 milliards de dollars cette année selon TrendForce.

Le marché de l’IA ne basculera pas simplement de GPU à ASIC comme on change d’interrupteur. La coexistence sera longue. Les GPU continueront à dominer beaucoup de charges, tandis que les ASIC occuperont le terrain où le volume justifie la conception propre. Pour les hyperscalaires, cette combinaison leur donnera plus de contrôle sur les coûts. Pour des fournisseurs comme Alchip, c’est l’opportunité de s’imposer dans l’infrastructure invisible de l’IA.

Questions fréquentes

Qu’est-ce qu’un ASIC IA ?

Un circuit conçu sur mesure pour exécuter des charges spécifiques d’intelligence artificielle, comme l’entraînement ou l’inférence, avec une efficacité supérieure à celle d’un processeur généraliste sur ce cas précis.

Les ASIC remplaceront-ils les GPU ?

Pas immédiatement. La coexistence est la tendance la plus probable. Les GPU conserveront leur importance pour leur flexibilité et leur écosystème, tandis que les ASIC gagneront du terrain pour les charges répétitives à grande échelle.

Pourquoi les hyperscalaires investissent-ils dans les ASIC ?

Pour réduire leur dépendance aux fournisseurs externes, améliorer le ratio performance/watt, maîtriser les coûts et adapter le silicium à leurs modèles et centres de données.

Quel rôle joue Alchip dans ce marché ?

Alchip propose des services de conception, d’empaquetage avancé et de gestion de production pour les entreprises qui développent des ASIC complexes pour l’IA, le HPC et les centres de données.

le dernier