Samsung Electro-Mechanics entre dans l’IA pour centres de données avec Qualcomm

Samsung Electro-Mechanics entre dans l'IA pour centres de données avec Qualcomm

Samsung Electro-Mechanics a commencé la fabrication en série de substrats FC-BGA pour le Qualcomm AI200, le premier accélérateur d’intelligence artificielle de Qualcomm destiné aux centres de données. Ce mouvement, dévoilé par ZDNet Korea et relayé par SamMobile, étend une relation qui était jusqu’ici principalement axée sur les processeurs mobiles et PC, vers un domaine en pleine croissance : l’infrastructure d’IA pour l’inférence.

Bien que cette nouvelle puisse paraître mineure face aux annonces importantes concernant les GPU, la mémoire HBM ou les racks de 160 kW, elle n’est pas anodine. Les sustrats avancés d’encapsulation jouent désormais un rôle critique dans la chaîne d’approvisionnement des semi-conducteurs. Sans eux, un processeur ne peut établir une connexion efficace avec la carte, dissiper la chaleur adéquatement ou supporter les vitesses électriques requises par un accélérateur moderne. Dans le domaine de l’IA pour centres de données, la bataille se joue aussi au niveau du wafer en silicium.

Ce que le FC-BGA apporte au Qualcomm AI200

FC-BGA signifie Flip-Chip Ball Grid Array. Il s’agit d’un type de substrat d’encapsulage qui connecte le processeur à la carte via de petites billes de soudure, ou bumps, plutôt que par un câblage traditionnel. L’avantage réside dans ses meilleures propriétés électriques et thermiques, deux paramètres essentiels lors du travail avec des semi-conducteurs de haute performance.

Selon les informations publiées, Samsung Electro-Mechanics a lancé la production dans son usine de Busan, en Corée du Sud. Le substrat FC-BGA destiné au Qualcomm AI200 comporterait entre 10 et 15 couches internes, offrant une complexité inférieure à celle des substrats de plus de 20 couches utilisés dans certains accélérateurs d’entraînement de très haut niveau. Cette différence correspond à l’approche de l’AI200 : il n’est pas conçu pour concurrencer directement les systèmes d’entraînement intense de NVIDIA ou AMD, mais plutôt pour l’inférence d’IA à l’échelle de rack.

Qualcomm a officiellement présenté l’AI200 et l’AI250 en octobre 2025 comme des solutions optimisées pour l’inférence en centres de données. L’AI200 devrait être disponible en 2026, tandis que l’AI250, prévue pour 2027, intégrera une architecture de mémoire basée sur le near-memory computing. La société affirme que l’AI200 comprendra 768 Go de mémoire LPDDR par carte, refroidissement liquide direct, PCIe pour la scalabilité interne, Ethernet pour l’interconnexion entre systèmes, confidential computing, et une consommation de 160 kW par rack. Contrairement à la première génération d’OPTI, cette architecture ne mise pas sur la mémoire HBM mais privilégie capacité, efficacité énergétique et réduction des coûts par inférence.

Élément Qualcomm AI200 Lecture pour centres de données
Type de produit Accélérateur d’IA pour inférence Optimisé pour exécuter des modèles pré-entraînés
Disponibilité prévue 2026 Première étape de la nouvelle feuille de route de Qualcomm
Mémoire 768 Go LPDDR par carte Plus grande capacité et coût réduit comparé aux solutions HBM
Encapsulage FC-BGA fabriqué par Samsung Electro-Mechanics, selon ZDNet Korea Élément critique pour la connexion électrique et la gestion thermique
Nombre de couches Entre 10 et 15, selon les informations Moins complexe que les accélérateurs de la gamme d’entraînement extrême
Scalabilité PCIe et Ethernet Intégration dans systèmes et racks d’inférence
Refroidissement Liquide direct en rack Conçu pour la densité dans les centres de données
Prochaine génération Qualcomm AI250 en 2027 Intégrera une architecture mémoire basée sur le near-memory computing

Qualcomm cherche une place entre NVIDIA, AMD et ses propres chipsets

L’entrée de Qualcomm sur le marché des accélérateurs d’IA pour centres de données n’est pas une nouveauté. La société développe depuis des années des NPUs, des processeurs à faible consommation, et des solutions d’IA pour appareils mobiles, mais le saut vers la scalabilité en racks d’inférence la place dans une nouvelle ligue. Le marché visé est dominé par NVIDIA pour l’entraînement, tandis que la compétition pour l’inférence, impliquant également AMD, Intel, Broadcom, Marvell, ainsi que des chips propriétaires des hyperscalers ou de nouvelles entreprises spécialisées, devient de plus en plus féroce.

Qualcomm ne cherche pas à copier le modèle HBM plus GPU traditionnel. Son argument se fonde sur le rapport performance/prix et performance/watt, la capacité de mémoire LPDDR, la compatibilité avec les frameworks d’IA, et la capacité à déployer des modèles déjà entraînés, notamment de langage et multimodaux. Cette différenciation est pertinente car l’inférence représente une part importante des coûts opérationnels liés à l’IA. Entraîner un modèle coûte cher, mais le servir quotidiennement à des millions d’utilisateurs l’est tout autant.

Le recours à l’encapsulage joue ici aussi un rôle clé. La disponibilité de substrats FC-BGA de haute qualité peut influencer la capacité à produire en volume des chips avancés. Les grands accélérateurs nécessitent des substrats à plusieurs couches, des matériaux comme l’ABF, des tolérances précises, et une capacité thermique suffisante. La chaîne d’approvisionnement était déjà tendue par les CPUs de serveur, GPU, ASIC d’IA, et chips réseau. La décision de Samsung Electro-Mechanics d’entrer comme fournisseur pour l’AI200 montre comment les fabricants coréens cherchent à capturer de la valeur dans l’expansion de l’IA, au-delà de la seule mémoire.

Pour Samsung Electro-Mechanics, cet accord représente une opportunité de croissance dans un segment à marges plus élevées. L’entreprise a déjà investi dans l’extension de son activité de FC-BGA, y compris un plan de 850 millions de dollars annoncé en 2021 pour augmenter ses capacités au Vietnam, et fournissait déjà des substrats pour processeurs Qualcomm en appareils mobiles. La transition vers une nouvelle catégorie, plus orientée serveurs et inférence, représente une étape logique.

L’inférence ouvre une nouvelle chaîne d’approvisionnement

L’AI200 permet également de mieux comprendre une différence essentielle en matière d’IA. Toutes les infrastructures ne se conçoivent pas de la même façon. Les accélérateurs pour entraînement intensif requièrent souvent de la mémoire HBM, des interconnexions très denses, des encapsulages plus sophistiqués, et des systèmes conçus pour gérer d’énormes volumes de données sur de longues périodes. En revanche, l’inférence doit fournir des réponses rapidement, avec une latence maîtrisée, un coût réduit, et une capacité à évoluer pour de nombreux utilisateurs ou agents.

Ainsi, un processeur d’inférence peut privilégier une architecture différente. L’utilisation de LPDDR5 réduit la complexité par rapport à la HBM et offre une capacité mémoire plus grande par carte, en dépit d’un profil différent en termes de bande passante. Dans les applications de modèles de langage où le coût par token et la consommation par rack sont critiques, cette option peut être compétitive si le logiciel et l’utilisation sont optimaux.

Qualcomm affirme que l’AI200 et l’AI250 s’inscriront dans une feuille de route annuelle pour les centres de données. L’AI250, prévu pour 2027, intégrera une architecture mémoire basée sur le near-memory computing, promettant un bond en termes de bande passante efficace et d’efficacité par rapport à l’AI200. Bien qu’il soit encore tôt pour connaître l’adoption concrète de ces solutions, la mise en production déjà entamée chez Samsung Electro-Mechanics indique une étape plus avancée qu’une simple annonce commerciale.

L’éventuelle entrée de LG Innotek dans la chaîne d’approvisionnement de l’AI200 dès l’année prochaine, selon les mêmes sources, envoie un autre signal : les substrats avancés deviennent un marché stratégique pour la Corée du Sud, à l’image de la mémoire HBM pour SK Hynix, Samsung Electronics et Micron. Dans le domaine de l’IA, la valeur ne se limite pas à la conception du processeur ; elle se répartit aussi entre fondeurs, encapsulage avancé, mémoire, substrats, réseaux, refroidissement et montage en racks.

Pour le marché du cloud, la tendance est claire : l’expansion de l’IA générative redessine toute la chaîne d’infrastructure. Qualcomm veut s’insérer dans les centres de données via l’inférence efficace. Samsung Electro-Mechanics souhaite que ses substrats deviennent une composante clé dans cette nouvelle demande. Quant aux fournisseurs cloud, ils recherchent des alternatives pour réduire les coûts d’exécution de modèles à grande échelle, en évitant de dépendre uniquement des plateformes les plus coûteuses.

Le succès de l’AI200 ne dépendra pas uniquement de la qualité du processeur. Cela dépendra aussi du logiciel, de la disponibilité, du prix, de l’intégration dans les racks, de la consommation, de la mémoire, des réseaux et de la capacité de production. La mise en production des FC-BGA à Busan envoie néanmoins un signal fort : Qualcomm est déjà en train d’ajuster sa chaîne d’approvisionnement pour que sa démarche dans l’IA de centre de données devienne une réalité commerciale.

Questions fréquentes

Que fabrique Samsung Electro-Mechanics pour Qualcomm ?
Selon ZDNet Korea et SamMobile, Samsung Electro-Mechanics a débuté la production de substrats FC-BGA pour le Qualcomm AI200, le premier accélérateur d’IA de Qualcomm destiné aux centres de données.

Qu’est-ce qu’un substrat FC-BGA ?
Il s’agit d’une plateforme avancée d’encapsulage reliant le processeur à la carte via des bumps de flip-chip. Elle offre de meilleures propriétés électriques et thermiques que le câblage traditionnel, ce qui la rend adaptée aux semi-conducteurs haute performance.

Le Qualcomm AI200 concurrence-t-il les GPU d’entraînement de NVIDIA ?
Pas exactement. L’AI200 est optimisé pour l’inférence d’IA, c’est-à-dire l’exécution de modèles pré-entraînés. Son architecture avec LPDDR favorise la capacité, l’efficacité et des coûts opérationnels plus faibles, sans viser une entraînement extrême basé sur la mémoire HBM.

Quand seront disponibles les Qualcomm AI200 et AI250 ?
Qualcomm prévoit une disponibilité commerciale de l’AI200 en 2026 et de l’AI250 en 2027. La version AI250 intégrera une architecture mémoire basée sur le near-memory computing pour augmenter la bande passante efficace.

via : sammobile

le dernier