Au cours des trois dernières années, la trajectoire de l’intelligence artificielle a été largement dominée par un mot : GPU. NVIDIA s’est imposée comme l’entreprise la plus influente du secteur, car ses accélérateurs constituaient la solution la plus rapide et la plus accessible pour entraîner et déployer des modèles de taille croissante. Cependant, le marché commence à s’intéresser davantage à une autre famille de puces : les ASIC, des processeurs conçus sur mesure pour des charges spécifiques.

Johnny Shen, président d’Alchip Technologies, estime que les ASIC mettront encore du temps à dépasser les GPU en termes de parts de marché globales, mais leur croissance pourrait s’accélérer dans les années à venir. Cette tendance s’inscrit dans une orientation de plus en plus marquée chez les grands fournisseurs de cloud : réduire leur dépendance aux puces standardisées et développer leur propre silicium, mieux adapté à leurs contraintes en termes de coûts, de consommation, de performance et d’intégration.

Il ne s’agit pas de prévoir la disparition des GPU. Ceux-ci restent la composante centrale pour l’entraînement de modèles, le développement d’IA et de nombreuses charges hybrides. Mais la prochaine phase du marché pourrait ne plus être exclusivement dominée par le chip le plus flexible, mais par celui offrant la meilleure efficacité pour une tâche précise. Sur ce point, les ASIC disposent d’un avantage naturel.

Pourquoi les hyperscalaires s’orientent vers des puces sur mesure

Les GPU ont gagné parce qu’ils sont polyvalents. Ils conviennent à l’entraînement, à l’inférence, à la recherche, à la simulation, aux graphismes, à la science des données et à de nombreuses charges parallèles. Cette flexibilité a été essentielle durant une période d’évolution rapide de l’IA, où personne ne voulait s’engager dans une architecture trop fermée.

Mais lorsque une charge se stabilise et s’exécute à grande échelle, l’équation change. Un hyperscaler qui sert des millions de requêtes d’inférence, entraîne ses propres modèles ou conçoit des services IA pour ses produits internes n’a pas toujours besoin de flexibilité maximale. Il cherche avant tout l’efficacité, le contrôle des coûts, une capacité d’approvisionnement fiable et des performances par watt. Un ASIC peut être conçu exactement pour répondre à ces besoins.

Google utilise depuis plusieurs années ses TPU. Amazon déploie ses solutions Trainium et Inferentia. Microsoft travaille avec un silicium propriétaire et noue des partenariats avec des tiers. Meta a développé ses propres accélérateurs MTIA. Broadcom est devenu un partenaire clé pour la fabrication de puces sur mesure destinées à de grands clients. Dans ce contexte, Alchip occupe une position distincte : elle ne concurrence pas en tant que marque de GPU, mais en tant que fournisseur de design et de services de fabrication pour les entreprises souhaitant produire leurs propres ASIC à des nœuds avancés.

Selon TrendForce, Alchip a indiqué lors de sa dernière conférence de résultats que la production en série d’un design pour un client important a commencé en mai, ce qui devrait stimuler la croissance de ses revenus cette année et la suivante. La même source indique qu’un accélérateur IA en 3 nm destiné à un client nord-américain commencera à représenter une part significative des livraisons dès le troisième trimestre, tandis que des projets en 2 nm avancent avec pour objectif un tape-out vers la fin de l’année.

Technologie Avantage principal Limitation
GPU Flexibilité, écosystème mature, large éventail de logiciels Coût élevé, consommation importante, dépendance à des fournisseurs dominants
ASIC Rapport performance/watt, coûts optimisés, conception sur mesure Moins flexible, coût initial plus élevé
TPU / accélérateurs cloud propriétaires Intégration verticale dans de grandes plateformes Généralement liés à un fournisseur spécifique
Chiplets + 2.5D/3DIC Scalabilité accrue, meilleure intégration de nœuds et empaquetage avancé Complexité accrue de conception, de test et de fabrication

Les pressions économiques sont considérables. D’après Alchip, citant des sources du marché, les ASIC pourraient offrir un avantage en coût total de possession compris entre 40 % et 65 % par rapport à d’autres solutions en silicium dans le cadre de déploiements massifs sur plusieurs années. La société estime également que le marché des ASIC pour l’IA pourrait passer de 13 milliards de dollars en 2024 à plus de 150 milliards en 2030, avec un taux de croissance annuel moyen proche de 50 %. Ces chiffres, ambitieux, doivent être pris comme des estimations internes, mais ils traduisent l’appétit du marché.

L’IA devient une conception de système

Le changement ne se limite pas à l’économie. Il est aussi technologique. Les nouveaux accélérateurs IA ne peuvent plus être considérés comme une seule puce isolée. Leur performance dépend de la combinaison de compute dies, de mémoire HBM, d’interconnexions, de chiplets, d’alimentations, d’empaquetage avancé et de refroidissement.

Alchip insiste sur cette approche avec sa plateforme 3DIC. La société affirme que la conception de processeurs IA évolue vers une vision systémique : il ne suffit plus d’accumuler davantage de transistors sur un die. Il faut décider quelle partie sera fabriquée en nœud de pointe, quels blocs peuvent être produits en nœuds plus matures, comment connecter les chiplets, comment alimenter le système et dissiper la chaleur.

Sa plateforme 3.5D permet de diviser de grands SoC en chiplets optimisés dans différentes technologies de nœud. Les dies de calcul peuvent être fabriqués en nœuds avancés, tandis que les fonctions d’entrée/sortie et la mémoire peuvent être maintenues en nœuds plus économiques. La société indique que cette architecture combine un scalabilité horizontale avec le découpage vertical sélectif et des technologies telles que CoWoS-S, CoWoS-R, CoWoS-L et TSMC-SoIC-X.

L’objectif est d’atténuer les limitations des puces monolithiques. À mesure que la complexité des designs augmente, apparaissent des problématiques liées à la limite de réticle, à la baisse de rendement de fabrication, aux coûts de masques plus élevés, à une consommation accrue et à une complexité pour déplacer les données. L’empaquetage avancé permet de construire des systèmes plus grands sans dépendre d’un seul die massif.

Alchip affirme que sa plateforme offre une densité d’interconnexion jusqu’à 3 à 5 fois supérieure, avec une consommation par bit réduite de 30 % à 40 %, et une latence pouvant être jusqu’à 35 % inférieure. Ces métriques, communiquées par l’entreprise, ne sont pas des comparatifs universels, mais elles illustrent un point essentiel : en IA, déplacer les données devient aussi crucial que leur traitement.

La compétition se déplace vers TSMC et l’empaquetage avancé

L’émergence potentielle des ASIC n’élimine pas les goulots d’étranglement ; elle les déplace. Si davantage d’hyperscalaires conçoivent leurs propres puces en 3 nm, 2 nm et adoptent des technologies d’empaquetage avancé, la pression sur TSMC, CoWoS, les substrats, les OSAT, la mémoire HBM et les capacités de test s’intensifiera encore.

Johnny Shen a souligné que la capacité de production en 3 nm est extrêmement tendue et que, selon lui, cette situation peut être encore plus préoccupante que la pénurie de mémoire. Pour une entreprise comme Alchip, entretenir une relation étroite avec TSMC n’est pas une simple opération : c’est un enjeu stratégique central. Disposer d’un bon design ne suffit pas si l’approvisionnement en wafers, les capacités d’empaquetage et la chaîne d’approvisionnement ne sont pas prêts à suivre en production de masse.

Alchip cherche également à renforcer cette position. En mars, la société a annoncé des avancées dans sa plateforme pour le design en 2 nm, avec plusieurs prototypes en cours, des tape-outs et des tests silicon réussis dès la première fabrication. Sa plateforme permet aussi de combiner dies de calcul en 2 nm avec des chiplets I/O en 3 nm ou 5 nm, une approche toujours plus pratique tant que les chiplets d’entrées/sorties en 2 nm ne seront pas encore disponibles.

Cet état d’esprit anticipe l’avenir des accélérateurs IA. Les puces ne seront plus simplement « une pièce » monolithique, mais un ensemble de blocs spécialisés intégrés dans un package complexe. La valeur ne résidera pas uniquement dans le design logique, mais dans la coordination physique, l’empaquetage, la gestion de la chaîne d’approvisionnement, la fabrication et la performance thermique.

Facteur clé Importance en ASIC IA
Nœud avancé Améliore la densité et l’efficacité des dies de calcul
Chiplets Permettent de combiner différents nœuds et réduisent le risque de puces trop volumineuses
HBM Fournit une bande passante suffisante pour l’entraînement et l’inférence
CoWoS / 3DIC Intègre mémoire, calcul et interconnexion dans un package avancé
Production de masse Détermine si le design atteint le marché à temps, avec un coût optimisé
Logiciels Peut limiter l’adoption si l’écosystème n’est pas mature

La gestion de la production devient un enjeu stratégique. Alchip souligne qu’au sein des ASIC à grand volume, la maîtrise du WIP (Work In Progress), des stocks, des performances, des délais de fabrication, de la logistique et de la capacité de production est aussi cruciale que la conception elle-même. Un retard de plusieurs mois dans un projet d’ASIC pour IA peut compromettre une feuille de route cloud, augmenter le coût d’une plateforme ou rendre un client dépendant de GPU plus coûteux plus longtemps.

Un marché plus fragmenté, mais pas moins dominé

La montée en puissance des ASIC ne signifie pas que NVIDIA perde du jour au lendemain sa position dominante. Sa force en logiciels, CUDA, bibliothèques, systèmes intégrés, réseaux, racks IA et relations clients reste considérable. La GPU demeure aussi plus adaptée à la recherche, aux charges évolutives, et aux déploiements où la flexibilité est plus importante que l’efficacité ultime.

Ce qui pourrait changer, c’est la composition de la croissance. Si l’entraînement de modèles de pointe reste concentré sur les GPU, mais que l’inférence à grande échelle migre partiellement vers des ASIC, le marché pourrait devenir plus fragmenté. On assistera à une multiplication des puces propres, des designs semi-personnalisés et à des collaborations accrues entre hyperscalers, fabricants d’ASIC, fondeurs et fournisseurs d’empaquetage.

GUC, autre acteur taïwanais, défend une thèse similaire : lorsque l’IA passe de l’entraînement aux applications finales, les ASIC peuvent offrir une efficacité par watt bien supérieure à celle des GPU généralistes coûteux. MediaTek a également revu à la hausse ses prévisions pour ses revenus liés à l’IA ASIC, en doublant son estimation de contribution cette année, passant de 1 milliard à 2 milliards de dollars, selon TrendForce.

Ce mouvement revêt une importance stratégique pour l’industrie. L’IA a commencé comme une compétition autour des modèles et des GPU. Elle devient désormais une course intégrée de la conception à la fabrication : design, IP, empaquetage, mémoire, production, logiciels, centres de données et consommation énergétique. Alchip souhaite occuper une place dans cette nouvelle chaîne de valeur, où les grands clients veulent des puces sur mesure sans nécessairement vouloir prendre en charge l’intégralité du processus de conception et de fabrication eux-mêmes.

Le marché de l’IA ne passera pas simplement de GPU à ASIC comme on change d’interrupteur. La coexistence sera probablement longue. Les GPU continueront à dominer de nombreuses charges, tandis que les ASIC occuperont le terrain là où le volume justifie la conception propre. Pour les hyperscalaires, cette combinaison pourrait leur permettre de reprendre le contrôle des coûts. Pour des fournisseurs comme Alchip, cela représente une opportunité de s’affirmer de plus en plus comme un acteur clé de l’infrastructure invisible de l’IA.

Questions fréquentes

Qu’est-ce qu’un ASIC IA ?
Un circuit conçu sur mesure pour exécuter des charges spécifiques d’intelligence artificielle, telles que l’entraînement ou l’inférence, avec une efficacité supérieure à celle d’un processeur généraliste sur ce cas précis.

Les ASIC remplaceront-ils les GPU ?
Pas immédiatement. Leur coexistence est la tendance la plus probable. Les GPU conserveront leur importance pour leur flexibilité et leur écosystème, tandis que les ASIC gagneront du terrain pour des charges très répétitives et à grande échelle.

Pourquoi les hyperscalaires investissent-ils dans les ASIC ?
Pour réduire leur dépendance aux fournisseurs externes, améliorer le ratio performance/watt, maîtriser les coûts et adapter le silicium à leurs modèles et centres de données.

Quel rôle joue Alchip dans ce marché ?
Alchip propose des services de conception, d’empaquetage avancé et de gestion de production pour les entreprises qui développent des ASIC complexes pour l’IA, le HPC et les centres de données.