Qualcomm amène Dragonfly au centre de données pour concurrencer dans l’IA générative

Qualcomm amène Dragonfly au centre de données pour concurrencer dans l'IA générative

Qualcomm souhaite que sa prochaine grande étape ne dépende pas du smartphone. La société a présenté une feuille de route complète pour les centres de données sous la marque Dragonfly, intégrant une CPU maison, des accélérateurs d’inférence, une nouvelle technologie de calcul proche de la mémoire, une connectivité à haute vitesse et un silicium personnalisé pour une clientèle industrielle. L’objectif est d’entrer dans l’infrastructure de l’intelligence artificielle au moment où l’inférence et les agents consomment une part croissante du budget des hyperscalers.

Cette annonce s’accompagne de signaux commerciaux importants. Qualcomm a annoncé un accord multigénérationnel avec Meta pour fournir des CPU destinées aux centres de données. Selon des sources du marché, Microsoft figure parmi ses futurs clients pour la nouvelle technologie High Bandwidth Compute. Des accords ont également été signés avec deux hyperscalers non identifiés pour du silicium personnalisé. Qualcomm ne présente pas seulement une famille de puces : elle cherche à démontrer qu’elle dispose déjà de clients, justifiant ainsi son ambition dans le domaine des centres de données.

Le principe est simple : l’IA axée sur les agents fera fortement augmenter le nombre de tokens, requêtes, outils, appels intermédiaires et tâches encadenées. Dans ce contexte, le coût par token et le rendement par watt deviennent aussi essentiels que la puissance brute. Si l’inférence devient la charge principale, l’infrastructure devra être plus efficace, plus modulaire et moins dépendante des architectures conçues principalement pour l’entraînement massif.

Dragonfly C1000 : une CPU ARM pour serveurs d’IA

L’élément central de cette feuille de route est la Qualcomm Dragonfly C1000, une CPU pour centres de données conçue pour des charges scalables, l’orchestration d’agents, un usage généraliste et l’infrastructure IA. Le produit sera basé sur des cœurs Oryon personnalisés, avec des fréquences supérieures à 5 GHz, plus de 250 cœurs en architecture chiplet, une connectivité PCIe Gen 7 à plus de 2 To/s, ainsi que le support CXL.

Qualcomm affirme que cette CPU offrira plus du double du rendement par watt par rapport aux références concurrentes, d’après des estimations basées sur ses spécifications. Il faut interpréter cette promesse comme une ambition de conception, et non comme une caractéristique déjà obtenue en production. La disponibilité commerciale est prévue pour 2028.

L’importance de la C1000 ne réside pas dans le remplacement des GPU, mais dans ce qui l’entoure. Les grands clusters d’IA nécessitent des CPU pour coordonner les accélérateurs, déplacer les données, exécuter des services de gestion, gérer la mémoire, assurer la connectivité web, servir des agents et réduire les goulets d’étranglement de l’infrastructure. Si une CPU consomme moins tout en maintenant une bonne performance par cœur, elle peut améliorer le coût total du système.

Produit Rôle prévu Calendrier
Dragonfly C1000 CPU pour serveurs, gestion d’agents, nœuds principaux et infrastructure IA 2028
Dragonfly AI200 Accélérateur d’inférence de première génération 2026
Dragonfly AI250 Accélérateur avec HBC Gen 1 Prévu pour une commercialisation à la mi-2027
Dragonfly AI300 Accélérateur d’inférence avec HBC Gen 2 Prévue pour une commercialisation en 2028
HBC Calcul proche de la mémoire pour réduire le « memory wall » Feuille de route multigénérationnelle
Silicium personnalisé ASIC pour clients à grande échelle Premier revenu avant fin 2026, selon Reuters

La CPU joue aussi un rôle de crédibilité pour une plateforme complète. Qualcomm ne souhaite pas vendre une simple carte isolée, mais une architecture rack avec du calcul, de la mémoire, de la connectivité, des logiciels et des options sur-mesure. C’est cette approche qu’elle maîtrise déjà dans les grands centres de données IA : la performance finale dépend de l’ensemble du système, pas uniquement du processeur.

HBC : l’ambition de briser le « mur de mémoire »

La composante la plus technique de cette annonce est Qualcomm High Bandwidth Compute, ou HBC. La société le décrit comme une architecture near-memory computing combinant calcul et mémoire haute bande passante en une solution 3D-stacked. Son objectif est de s’attaquer à un problème clé de l’IA moderne : déplacer des données consomme beaucoup d’énergie, de temps et d’argent.

Le « memory wall » n’est pas une nouveauté, mais l’IA l’a porté à un niveau critique. Les grands modèles nécessitent un accès continu à des volumes énormes de paramètres, contextes, mémoire intermédiaire et données. En inférence, en particulier avec des agents qui raisonnent longtemps ou appellent des outils, le débit et l’efficacité mémoire déterminent souvent le coût par token.

Qualcomm affirme que HBC Gen 1, intégré dans AI250, offrira un débit de 133 TB/s par carte et un bond de 18 fois en bande passante effective par rapport à AI200 équipé de LPDDR5X. Avec HBC Gen 2, la AI300 pourrait atteindre 54 fois le débit d’AI200. La société avance également que cela donnera un gain de 6 fois en bande passante par watt par rapport à la HBM et 200 fois la capacité par watt par rapport à la SRAM, en comparant des spécifications normalisées, par carte ou par rack.

Technologie Promesse technique de Qualcomm
HBC Gen 1 dans AI250 133 TB/s par carte, 18x AI200
HBC Gen 2 dans AI300 54x AI200
HBC vs HBM 6x plus de bande passante par watt, selon spécifications
HBC vs SRAM 200x plus de capacité par watt à l’échelle rack
Objectif Réduire la consommation et le coût de l’inférence

C’est une des initiatives les plus audacieuses de Qualcomm. Alors que Nvidia domine avec la HBM dans les GPU d’IA et que d’autres explorent la mémoire SRAM ou des architectures spécialisées, Qualcomm mise sur son expertise historique en faible consommation, LPDDR, intégration système et empaquetage avancé pour proposer une alternative. La question est de savoir si cette avance sera suffisante pour des charges réelles, avec des modèles concrets et un logiciel mature.

Dragonfly AI300 : une cadence annuelle pour l’inférence

Le Dragonfly AI300 sera la troisième génération de la feuille de route des accélérateurs d’inférence, après AI200 et AI250. Qualcomm souhaite maintenir une cadence annuelle, courante pour les GPU d’IA, mais moins répandue chez un nouvel acteur s’inscrivant de nouveau dans les centres de données.

AI300 vise une plateforme rack pour l’inférence, refroidie par air ou liquide direct, avec HBC Gen 2, déploiements dégroupés et support pour de grands modèles de langage et modèles multimodaux. La société espère atteindre entre 4 et 8 fois le rendement par watt par rapport aux architectures GPU existantes, calculé en fonction du débit mémoire par watt et par carte. Elle évoque également une montée en puissance avec UALink, ESUN, ainsi que des solutions cuivre et optiques pour l’expansion horizontale.

La focalisation sur l’inférence n’est pas anodine. La formation de modèles de pointe restera probablement une activité dominée par Nvidia, Google TPU, Amazon Trainium, chips propriétaires de grands laboratoires ou solutions coûteuses. Cependant, l’inférence, qui concerne chaque utilisateur, agent ou application d’entreprise, est vouée à croître. Si Qualcomm parvient à réduire les coûts et la consommation dans cette couche, elle pourra se faire une place, même sans dominer l’entraînement.

Meta, Microsoft et l’écosystème hyperscaler en contexte

L’accord avec Meta est la donnée commerciale la plus visible. La Qualcomm Dragonfly C1000 devrait alimenter une partie de la future flotte de serveurs de Meta, dès la seconde moitié de 2028. Mark Zuckerberg a lié cette collaboration à l’infrastructure nécessaire pour déployer une « superintelligence personnelle » à l’échelle mondiale, une ambition hardie mais qui permet de saisir l’ampleur des investissements de Meta en IA.

Reuters a également indiqué que Microsoft compte utiliser des puces HBC de Qualcomm pour ses tâches d’IA et que deux clients hyperscalers non identifiés devraient recourir à du silicium personnalisé. Qualcomm espère générer 5 milliards de dollars de revenus en centres de données pour l’année fiscale 2027 et 15 milliards en 2029, selon cette même source. Ces chiffres, importants pour une société encore très liée aux smartphones, illustrent pourquoi le centre de données devient une priorité stratégique majeure.

Client ou partenaire Lecture stratégique
Meta Confirme l’utilisation de Dragonfly C1000 comme CPU de centre de données
Microsoft Introduit HBC dans les charges IA, selon Reuters
Hyperscalers non identifiés Renforcent leur portefeuille en silicium personnalisé
Hugging Face Relie modèles ouverts et développeurs avec les plateformes Qualcomm
Modular Renforce logiciels, portabilité et déploiement IA
Plus de 35 partenaires Indicateur de soutien du secteur, incluant fabricants, mémoire, réseaux, serveurs et cloud

Le soutien de plus de 35 sociétés du secteur, parmi lesquelles des acteurs liés aux serveurs, mémoire, réseaux, stockage et fabrication, contribue à construire une véritable plateforme. En centres de données, personne ne gagne seul. Il faut des cartes, de la mémoire, des racks, de la refroidissement, de la validation, des réseaux, du stockage, des intégrateurs et des clients prêts à déployer en volume.

Le défi : concurrencer des écosystèmes très établis

Qualcomm n’entre pas sur un marché vacant. Nvidia possède des GPU, Grace, des réseaux, CUDA, NVLink, des systèmes complets et une large communauté. AMD rivalise avec ses EPYC et Instinct. Intel maintient ses Xeon et ses accélérateurs propres. Amazon, Google et Microsoft ont leurs propres CPU ou accélérateurs internes. Broadcom et Marvell gagnent du terrain sur les ASIC personnalisés. Cerebras, SambaNova, Groq et d’autres acteurs cherchent des niches spécifiques.

L’avantage potentiel de Qualcomm réside dans l’efficacité, l’intégration et le coût. Son expérience dans le mobile l’a longtemps obligé à optimiser le rendement par watt, la mémoire efficace et la conception système. Mais le centre de données exige d’autres qualités : fiabilité, support industriel, cycles de validation longs, compatibilité logicielle, sécurité, observabilité et une exécution fiable sur plusieurs années.

L’acquisition de Modular et la collaboration accrue avec Hugging Face ont pour but de combler une partie de cette faiblesse. Qualcomm sait que le hardware seul ne suffit pas. Si les développeurs ne peuvent pas déployer facilement leurs modèles, si les frameworks ne sont pas performants ou si le transfert de charges sur des GPU établis demande trop de travail, l’adoption sera limitée.

L’importance de cette évolution

L’annonce de Dragonfly montre que l’infrastructure IA s’éloigne d’une vision centrée uniquement sur les GPU pour l’entraînement. L’inférence, les agents et les déploiements hybrides nécessitent des CPU efficaces, une mémoire abondante, des réseaux rapides, des accélérateurs spécialisés et un logiciel capable de répartir la charge. Les centres de données IA seront plus hétérogènes.

Pour les hyperscalers, cette diversité est attrayante car elle réduit la dépendance, permet l’ajustement précis du matériel aux charges spécifiques et améliore le coût par opération. Pour Qualcomm, c’est une occasion de diversifier ses sources de revenus et de s’éloigner de la pression du marché mobile. Pour NVIDIA et ses concurrents, cela indique que la compétition se déplace vers des systèmes complets plutôt que seulement des composants isolés.

Cela dit, le calendrier impose de la prudence. La C1000 ne sera pas prête avant 2028, tout comme la AI300. HBC Gen 1 débutera sa phase de démonstration en 2027. Avant de parler de mutation du marché, il faudra vérifier la performance réelle, la disponibilité, la stabilité du logiciel, les déploiements concrets et le coût total en production.

Qualcomm a tracé une feuille de route ambitieuse, avec des clients stratégiques et une philosophie claire : la réussite de l’IA axée sur les agents se mesurera en tokens par watt. Si la société parvient à le prouver dans des racks réels, Dragonfly pourrait devenir bien plus qu’un simple remodelage des centres de données : une vraie entrée de Qualcomm dans une infrastructure jusqu’ici hors de portée.

Questions fréquentes

Qu’est-ce que Qualcomm Dragonfly ?
La nouvelle gamme de solutions Qualcomm pour les centres de données d’intelligence artificielle, comprenant des CPU, des accélérateurs d’inférence, la technologie HBC, la connectivité et du silicium personnalisé.

Que propose Dragonfly C1000 ?
Une CPU pour centres de données basée sur des cœurs Oryon, avec plus de 250 cœurs, une architecture chiplet, PCIe Gen 7, CXL, et une focalisation sur l’efficience pour les charges IA et agents.

Qu’est-ce que High Bandwidth Compute ou HBC ?
Une technologie Qualcomm qui combine calcul et mémoire à haute bande passante dans une architecture 3D-stacked pour réduire le goulet d’étranglement du transfert de données et améliorer l’efficience par token.

Quand ces produits seront-ils commercialisés ?
HBC Gen 1 avec AI250 est prévu pour mi-2027. La CPU C1000 et l’AI300 visent une disponibilité ou un lancement commercial en 2028, selon la feuille de route annoncée.

source : Qualcomm

le dernier