Des entreprises telles que Cohere, IBM et Mistral AI exploitent déjà les nouveaux systèmes NVL72 dans le cloud pour former des agents d’IA à grande échelle.
CoreWeave s’impose comme l’un des premiers fournisseurs de cloud à déployer à grande échelle les systèmes NVIDIA GB200 NVL72, offrant ainsi à ses clients l’accès à des milliers de GPUs Grace Blackwell. Des pionniers de l’intelligence artificielle tels que Cohere, IBM et Mistral AI tirent déjà parti de cette infrastructure pour former et déployer des modèles avancés d’IA avec des performances sans précédent.
Conçus pour les charges de travail des agents d’IA et le raisonnement, les nouveaux systèmes NVL72 offrent une architecture comportant 72 GPUs interconnectés via NVLink et 36 CPUs Grace, permettant un traitement massif des données avec une latence réduite, une efficacité énergétique et une évolutivité inégalées.
Cohere : jusqu’à 3 fois plus de performance pour des modèles de 100 milliards de paramètres
Cohere, une entreprise spécialisée dans les solutions d’IA pour les entreprises, a déjà commencé à utiliser ces systèmes pour former des modèles massifs et déployer des agents personnalisés via sa plateforme North. Selon la société, les systèmes NVL72 offrent jusqu’à 3 fois plus de performance que les précédents GPUs Hopper, même avant d’appliquer des optimisations spécifiques pour Blackwell.
Autumn Moulder, vice-présidente de l’ingénierie chez Cohere, souligne que l’intégration a été simple et que la mémoire unifiée et la précision FP4 du nouveau système permettent des inférences plus efficaces et économiques. “Nous sommes impatients de voir encore des améliorations avec d’éventuelles optimisations futures”, a-t-elle déclaré.
IBM : propulsant les modèles Granite avec une IA sûre et efficace
IBM a également accès à des milliers de GPUs GB200 via CoreWeave pour accélérer l’entraînement de sa gamme de modèles Granite, qui seront open source et orientés vers des applications professionnelles axées sur la sécurité, la rapidité et le coût.
Ces modèles constituent la base de solutions telles que IBM watsonx Orchestrate, destinées à l’automatisation des flux de travail à l’aide d’agents d’IA. IBM utilise également son système de stockage IBM Storage Scale System, intégré au cloud de CoreWeave, pour garantir des performances d’E/S à la hauteur de ces charges.
“Cette collaboration avec CoreWeave nous permettra de construire des modèles hautes performances et à faible coût pour la nouvelle génération d’IA d’entreprise”, a déclaré Sriram Raghavan, vice-président de l’IA chez IBM Research.
Mistral AI : doublant les performances pour des modèles open source
La startup française Mistral AI, reconnue pour ses modèles open source à forte capacité de raisonnement, reçoit ses premiers mille GPUs GB200 pour accélérer le développement de nouvelles générations de modèles linguistiques.
Selon Thimothee Lacroix, cofondateur et CTO de Mistral, “sans optimisations supplémentaires, nous avons déjà constaté une amélioration de 2× dans l’entraînement de modèles denses”, ouvrant ainsi de nouvelles possibilités pour l’évolutivité de leurs modèles et des inférences en temps réel.
CoreWeave et le déploiement massif de NVIDIA Blackwell
CoreWeave ne se limite pas à offrir ces instances aux clients d’entreprise à long terme, mais les rend également disponibles pour d’autres utilisateurs via son infrastructure cloud. Chaque instance comprend NVLink à l’échelle de rack, avec des réseaux NVIDIA Quantum-2 InfiniBand, et peut évoluer jusqu’à 110.000 GPUs, se positionnant comme l’une des plateformes les plus puissantes au monde pour le développement de l’intelligence artificielle.
Cette avancée marque un nouveau jalon dans l’évolution du calcul accéléré, permettant aux entreprises de former et d’implémenter des modèles d’IA de plus en plus complexes et puissants, avec une efficacité sans précédent.
Avec cette mise en œuvre, CoreWeave et NVIDIA renforcent leur position de leader dans la course à l’équipement de l’infrastructure nécessaire à l’intelligence artificielle de prochaine génération.
Source : Nvidia