Lors de la conférence Hot Chips 2025, NVIDIA a présenté en avant-première un de ses développements les plus attendus : le GB10 Superchip. Ce processeur hybride, combinant CPU et GPU dans un même module, a été conçue avec une technologie de fabrication en 3 nanomètres et vise à révolutionner l’expérience des AI PCs. Ce chip ne représente pas seulement une étape supplémentaire dans l’évolution des systèmes compacts et performants, mais concrétise également la stratégie de NVIDIA pour porter la puissance des superordinateurs d’intelligence artificielle vers les ordinateurs de bureau et stations de travail personnels.
Le GB10 Superchip est composé de deux « dielets » interconnectés par une ingénierie avancée en 2,5D. Le premier, le S-Dielet, héberge 20 cœurs ARM v9.2 répartis en deux groupes de 10, avec une mémoire cache L2 dédiée et 32 Mo de cache L3 partagé. Le second, le G-Dielet, renferme la GPU basée sur l’architecture Blackwell, équipée de cœurs Tensor de 5ème génération, avec support pour DLSS 4, le traçage de rayons RTX et une puissance atteignant jusqu’à 1 000 TOPS en précision FP4.
Concrètement, une seule station équipée du GB10 peut exécuter des modèles comptant jusqu’à 200 milliards de paramètres en inference, ou affiner des modèles volumineux de 70 milliards, des capacités jusqu’ici réservées aux centres de données spécialisés.
En complément, NVIDIA a dévoilé le système DGX Spark, décrit comme un « mini superordinateur de IA pour le bureau ». Pèse à peine 1,2 kg, consomme environ 140 W, et offre une performance équivalente à une station DGX traditionnelle, avec 128 Go de mémoire unifiée LPDDR5x-9400, jusqu’à 4 To de stockage NVMe, et une connectivité multimédia avancée, dont Ethernet 10 GbE, Wi-Fi 7 et Bluetooth 5.3. Il supporte jusqu’à 8K à 120 Hz via HDMI 2.1a ou du 4K à 120 Hz via DisplayPort, intégrant le système d’exploitation DGX Base OS et l’ensemble du logiciel NVIDIA pour l’IA.
Une caractéristique majeure du GB10 est son architecture de mémoire unifiée (UMA), permettant à la CPU et à la GPU d’accéder simultanément à un même espace mémoire cohérent, accélérant significativement entraînements et inférences. De plus, la connectivité via NVLINK C2C et les cartes ConnectX-7 autorise la mise en réseau de plusieurs DGX Spark, pouvant manipuler des modèles de plus de 405 milliards de paramètres dans des configurations distribuées. Une avancée qui positionne ce chip comme un pont entre les PC haut de gamme et les serveurs de grande échelle.
Ce développement est aussi le fruit d’une collaboration étroite avec MediaTek, qui a apporté son expertise en propriété intellectuelle pour la conception de la CPU. Cette synergie a permis une intégration fine entre la gestion mémoire et le trafic GPU pour optimiser la consommation électrique.
Bien que le DGX Spark soit aujourd’hui l’incarnation la plus visible de cette technologie, NVIDIA prévoit déjà d’étendre cette innovation à des produits grand public sous les séries N1 et N1X. Ces System-on-Chip (SoC) destinés aux portables et mini PC s’appuieraient sur le même socle technologique, apportant l’intelligence artificielle directement aux appareils de tous les jours. Ce mouvement marque une étape significative vers la démocratisation de la puissance de calcul IA locale, essentielle face aux enjeux de confidentialité et de souveraineté technologique, tout en ouvrant la voie à des applications dans la médecine, la robotique ou le divertissement.
Pour les entreprises et développeurs, cette plateforme représente une nouvelle opportunité pour prototyper, affiner, et déployer à grande échelle des modèles IA, notamment dans les domaines du renseignement, de la vision par ordinateur ou de la robotique, tout en pouvant s’intégrer dans des workflows existants grâce à des frameworks comme Isaac ou Metropolis.
En annonçant le GB10, NVIDIA s’engage dans une nouvelle course pour les AI PCs, rivalisant avec Intel et AMD, mais avec l’avantage de bénéficier d’un écosystème logiciel consolidé et d’un GPU Blackwell déjà éprouvé dans les centres de données globaux. Si cette technologie parvient à être abordable pour le marché de consommation, cela pourrait transformer radicalement la façon dont l’intelligence artificielle est intégrée à notre quotidien, passant d’une spécialité de centres de données à une technologie accessible directement sur nos bureaux ou dans nos maisons.
Ce processus illustre comment la frontière entre supercalcul et informatique personnelle devient de plus en plus floue, permettant à un plus grand nombre de bénéficier de capacités auparavant réservées aux grandes infrastructures. La promesse d’un futur où l’IA locale est à la portée de tous se rapproche grâce à des innovations comme le GB10.
Questions fréquentes :
-
Qu’est-ce que le NVIDIA GB10 Superchip ?
C’est un processeur hybride en 3 nm combinant 20 cœurs ARM v9.2 et une GPU Blackwell capable d’atteindre 1 000 TOPS en FP4 pour l’IA. -
Quelles applications peut exécuter le DGX Spark avec le GB10 ?
De la prototypisation à l’inférence, en passant par le fine-tuning de modèles jusqu’à 70 000 milliards de paramètres ou le déploiement de modèles de 200 milliards, notamment dans la robotique, la science des données ou les systèmes embarqués. -
En quoi le GB10 diffère-t-il des autres puces grand public ?
Il s’agit d’un véritable superordinateur miniature, doté d’une mémoire unifiée élevée, d’un multi-die innovant, et capable de se connecter à d’autres unités grâce aux interconnexions NVLINK. -
Est-ce que le GB10 sera intégré dans des portables ou mini PC grand public ?
NVIDIA prévoit que des versions dérivées, notamment les SoC N1 et N1X, permettront d’intégrer cette technologie dans des appareils portables et petits formats, apportant la puissance IA à la maison ou au bureau.
Sources : wccftech et NVIDIA