NVIDIA Blackwell Ultra : la puce qui inaugure l’ère des usines d’IA

NVIDIA Blackwell Ultra : la puce qui inaugure l'ère des usines d'IA

NVIDIA fait une nouvelle avancée majeure dans le domaine de l’intelligence artificielle à grande échelle avec la présentation de son tout dernier processeur, le Blackwell Ultra. Plus qu’une simple évolution technologique, cette nouvelle puce incarne le cœur de ce que la société appelle désormais l’ère des usines d’IA, infrastructures capables de former et d’exécuter des modèles multimodaux comportant des milliards de paramètres, tout en étant capables de fournir des services en temps réel à des milliards d’utilisateurs.

Selon les détails publiés sur le site dédié aux développeurs de NVIDIA, cette avancée résulte d’innovations combinant le silicium, la mémoire et l’interconnexion afin d’offrir des niveaux de performance et d’efficacité sans précédent.

Le Blackwell Ultra présente une conception duale, associant deux die de la taille maximale autorisée par la photolithographie, reliés par une interconnexion personnalisée NV-HBI à 10 TB/s. Fonctionnant comme un seul accélérateur programmable compatible CUDA, il conserve l’environnement logiciel que NVIDIA a perfectionné depuis vingt ans. Avec 208 milliards de transistors, cette architecture dispose d’une puissance 2,6 fois supérieure à celle de la génération Hopper, intégrés dans un seul chip logique.

Au cœur de chaque GPU, 160 multiprocesseurs de flux (SM) sont organisés en huit clusters. Chaque SM comprend 128 cœurs CUDA, quatre Tensor Cores de cinquième génération utilisant la seconde version du Transformer Engine, optimisés pour des formats à faible précision comme FP8, FP6 et le nouveau NVFP4, ainsi que 256 Ko de mémoire Tensor conçus pour réduire le trafic vers la mémoire externe. La nouvelle norme NVFP4 utilise un équilibrage entre efficacité et précision, permettant une consommation mémoire jusqu’à 3,5 fois inférieure et une puissance dense atteignant 15 PetaFLOPS.

En matière d’accélération des IA, NVIDIA a doublé la rapidité des unités spécialisées pour le calcul softmax, atteignant 10,7 teraexponentielles par seconde, ce qui réduit considérablement le temps de traitement pour les modèles conversationnels, améliore l’efficacité énergétique et offre une meilleure expérience utilisateur.

La mémoire intégrée de chaque GPU atteint 288 Go de HBM3e, soit 50 % de plus que le Blackwell standard et 3,6 fois plus que Hopper, avec un débit de 8 TB/s. Cette capacité permet d’héberger des modèles dépassant les 300 milliards de paramètres, d’allonger la fenêtre de contexte dans les modèles linguistiques et d’effectuer des inférences massivement concurrentes avec une latence réduite.

L’interconnexion joue un rôle crucial, supportant NVLink 5 avec 1,8 TB/s de bande passante bidirectionnelle, doublant ainsi la capacité de Hopper. Elle peut être intégrée dans des topologies pouvant atteindre 576 GPU sans congestion, et se connecte aux CPU Grace via NVLink-C2C à 900 GB/s ou via PCIe Gen6 à 256 GB/s. Ces caractéristiques permettent la construction de clusters NVL72, combinant 72 GPU pour un débit total de 130 TB/s, adaptés à l’entraînement et à l’inférence à l’échelle.

Au-delà des performances, le Blackwell Ultra intègre des fonctionnalités de sécurité et de fiabilité destinées au déploiement industriel : partitions Multi-Instance GPU (MIG), confidentialité via le Computing Confidentiel et le TEE-I/O, ainsi que la surveillance et la maintenance prédictive via des outils d’intelligence artificielle.

Ce processeur prend également en charge le traitement multimodal grâce à des moteurs spécialisés pour la vidéo, les images et la compression des données, avec des codecs comme NVDEC, NVJPEG, et un décodeur à 800 GB/s facilitant l’accélération des flux de données lors des entraînements.

NVIDIA propose différentes configurations intégrant le Blackwell Ultra, notamment le Grace Blackwell Ultra Superchip avec un CPU Grace et deux GPU, le GB300 NVL72 en rack liquide de 36 superchips, et des solutions standard telles que les systèmes HGX et DGX B300.

En termes d’impact économique, cette nouvelle génération promet de réduire significativement le coût par token, avec une amélioration de 50 % en efficacité énergétique par rapport à Hopper. Cela ouvre la voie à une adoption plus large dans des secteurs clés comme la santé, l’automobile, la finance ou l’industrie du divertissement, où la réduction des coûts d’infrastructure et d’énergie est cruciale.

En résumé, avec le Blackwell Ultra, NVIDIA ne se contente pas de renforcer sa position de leader : elle établit une nouvelle référence technique et économique pour la prochaine décennie de l’intelligence artificielle.

le dernier