CoreWeave marque une étape avec le NVIDIA GB300 NVL72 : la première nuage à déployer la plateforme Blackwell Ultra à l’échelle rack

CoreWeave marque une étape avec le NVIDIA GB300 NVL72 : la première nuage à déployer la plateforme Blackwell Ultra à l’échelle rack

CoreWeave (Nasdaq : CRWV), acteur majeur de l’infrastructure cloud spécialisée en intelligence artificielle, a franchi une étape significative en devenant le premier fournisseur mondial à déployer la plateforme NVIDIA GB300 NVL72, une solution à grande échelle intégrant les dernières GPU Blackwell Ultra. Cette avancée positionne la société à la pointe du calcul accéléré, surpassant des concurrents tels qu’Amazon Web Services, Google Cloud et Microsoft Azure pour l’accès aux technologies les plus innovantes dans les domaines de l’IA générative, de l’inférence des agents et du raisonnement multimodal.

Ce déploiement représente une amélioration sans précédent en matière de performance. La plateforme GB300 NVL72 constitue une avancée majeure dans l’architecture Blackwell de NVIDIA, avec des chiffres impressionnants :

– Jusqu’à 10 fois plus rapide dans les réponses aux agents conversationnels.
– Cinq fois plus efficace en consommation d’énergie par rapport à Hopper (H100).
– Quarante-cinq fois plus de débit d’inférence pour les modèles de raisonnement.

Chaque système NVL72 comprend 72 GPU NVIDIA Blackwell Ultra (GB200), permettant l’inférence FP4 et l’entraînement FP8, ainsi que 36 CPUs Grace basées sur ARM Neoverse pour les tâches de contrôle et de calcul général, et 36 DPUs BlueField-3 avec capacités avancées en réseau et sécurité. Avec une interconnexion de 14,4 GB/s par GPU via NVLink et NVSwitch, la plateforme offre une capacité d’inférence atteignant 1,1 exaFLOPS FP4 par rack, la plaçant parmi les systèmes les plus puissants accessibles au public.

Comparé à d’autres hyperscalers, CoreWeave dépasse la concurrence en performance brute, efficacité énergétique et rapidité de déploiement. Alors que AWS et Microsoft collaborent avec AMD pour développer leurs solutions, CoreWeave confirme son engagement envers NVIDIA et a été le premier à mettre à disposition sa plateforme GB300 NVL72 en accès général pour ses clients.

Au-delà du matériel, la société a intégré cette nouvelle plateforme à sa pile logicielle cloud-native comprenant Kubernetes, Slurm sur Kubernetes pour le calcul haute performance, un gestionnaire de cycle de vie pour les racks, ainsi qu’une intégration approfondie avec Weights & Biases pour une surveillance détaillée du matériel et de la santé des clusters. Cette synergie permet aux ingénieurs en IA de faire évoluer leurs modèles avec une visibilité sans précédent sur chaque GPU, rack ou région.

En juin, CoreWeave a atteint un autre jalon en formant le modèle Llama 3.1, avec 405 milliards de paramètres, en seulement 27,3 minutes grâce à 2 500 superchips GB200. Cette performance, inscrite dans le cadre de MLPerf Training v5.0, a été réalisée en collaboration avec NVIDIA et IBM, renforçant sa position de leader dans le domaine de la computation IA.

De plus, CoreWeave est le seul fournisseur à disposer d’une certification Platinum pour le système ClusterMAX™ de SemiAnalysis, une mesure d’efficacité, de disponibilité et d’évolutivité des infrastructures cloud dédiées à l’IA.

Selon David Carrero, cofondateur de Stackscale, « le déploiement des systèmes GB300 NVL72 marque le début d’une nouvelle ère de l’infrastructure cloud, où la performance par watt et la capacité à faire évoluer des agents autonomes deviennent stratégiques. L’intégration entre matériel de pointe, logiciel natif et observabilité constitue la réelle différence de CoreWeave dans cette compétition ».

En consolidant ce déploiement, CoreWeave confirme sa stratégie : fournir à ses laboratoires, startups et entreprises d’IA un environnement optimisé, évolutif et prêt pour la prochaine génération de modèles fondamentaux. La société prévoit d’étendre ces systèmes à ses centres de données en Amérique du Nord et en Europe d’ici la fin du premier semestre 2025, confirmant ainsi sa avance dans un domaine où chaque seconde et chaque watt comptent.

le dernier