NVIDIA Vera arrive chez OpenAI, Anthropic et Oracle : le CPU pour l’ère des agents

NVIDIA Vera arrive chez OpenAI, Anthropic et Oracle : le CPU pour l'ère des agents

NVIDIA a commencé la livraison de ses premiers systèmes basés sur Vera, sa nouvelle CPU conçue pour les charges de travail d’intelligence artificielle agissante. La société affirme que ces premiers équipements ont déjà été remis à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure, marquant ainsi le passage de Vera du stade de lancement technique à celui d’utilisation par des clients stratégiques. Il ne s’agit pas d’une CPU supplémentaire dans le catalogue des centres de données : NVIDIA souhaite en faire le nœud central des usines d’IA, où s’entraînent, s’exécutent et se coordonnent des modèles d’IA à grande échelle.

Cette annonce intervient à un moment où l’attention se porte souvent principalement sur les GPU, mais l’intelligence artificielle agissante modifie la répartition des charges au sein des centres de données. Un agent ne se limite pas à générer une réponse pour ensuite s’arrêter ; il peut rechercher des informations, lancer des outils, exécuter du code, consulter des bases de données, ouvrir des environnements isolés, analyser des documents, coordonner plusieurs étapes et maintenir un contexte sur de longues sessions. Une grande partie de ce traitement ne se déroule pas uniquement dans la GPU, mais autour d’elle. C’est précisément là que NVIDIA veut positionner Vera.

Pourquoi une CPU redevient stratégique dans l’IA

Ces dernières années, la narration autour de l’intelligence artificielle a été largement centrée sur les GPU. NVIDIA a dominé ce marché grâce à ses accélérateurs, à ses logiciels et à son écosystème de développeurs. Mais lorsque les modèles commencent à fonctionner comme des agents, le goulet d’étranglement ne se limite pas uniquement aux calculs matriciels. Il apparaît également dans l’orchestration, la gestion de la mémoire, les appels aux outils, l’exécution du code, les environnements sandbox, la récupération d’informations et le déplacement de données entre processus.

Vera a été pensée pour ces types de charges. Selon NVIDIA, elle intègre 88 cœurs Olympus conçus en interne, 1,2 téraoctets par seconde de bande passante mémoire et une performance par cœur jusqu’à 50 % supérieure en charge. La CPU est compatible Armv9.2 et supporte 176 threads via NVIDIA Spatial Multithreading, une technique qui répartit les ressources physiques du cœur plutôt que de simplement alterner entre les threads au fil du temps.

La société met aussi en avant la prise en charge jusqu’à 1,5 téraoctets de mémoire LPDDR5X, la connectivité NVLink-C2C de seconde génération avec 1,8 TB/s de bande passante cohérente, ainsi que des capacités de Confidential Computing. En pratique, NVIDIA vise à ce que Vera ne soit pas uniquement un processeur hôte accompagnant une GPU, mais une CPU capable de gérer des milliers d’environnements logiciels parallèles et d’alimenter efficacement les flux de données dans des systèmes accélérés.

Caractéristique de NVIDIA Vera Données annoncées
Nœuds 88 Olympus
Threads 176 via Spatial Multithreading
Architecture Armv9.2
Bande passante mémoire Jusqu’à 1,2 TB/s
Capacité mémoire Jusqu’à 1,5 To
NVLink-C2C Jusqu’à 1,8 TB/s
Amélioration par cœur Jusqu’à 50 % en charge
Compatibilité Systèmes autonomes, Vera Rubin NVL72, plateformes HGX Rubin

Le message du secteur est clair. Si les agents vont générer davantage d’appels, de code et de requêtes aux données internes, la CPU cesse d’être un composant secondaire. Dans de nombreuses charges agissant comme celles-ci, la GPU accélère le modèle, mais c’est la CPU qui orchestre le travail permettant à ce modèle d’opérer efficacement.

Livraisons aux laboratoires d’IA et dans le cloud

Le déploiement initial comporte une forte portée symbolique. NVIDIA n’a pas annoncé de disponibilité massive et généralisée, mais des livraisons à certains des acteurs qui impulsent le rythme de l’IA : Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure. Ian Buck, vice-président de l’Hyperscale et du High-Performance Computing chez NVIDIA, a personnellement remis les premiers systèmes, selon le blog officiel de la société.

Chez Anthropic, Vera apparaît comme une pièce prometteuse pour les charges agissant comme celles évoquées. Chez OpenAI, la livraison est liée au besoin d’alimenter de nouvelles charges de travail. Chez SpaceXAI, NVIDIA indique que Vera est en cours d’évaluation pour l’apprentissage par renforcement et les pipelines de simulation basés sur des agents. Chez Oracle Cloud Infrastructure, le message est encore plus ambitieux : OCI prévoit de déployer des centaines de milliers de CPU NVIDIA Vera à partir de 2026, dans le but d’offrir une infrastructure agissante de production à grande échelle.

Cela est d’une importance capitale, car Vera ne sera pas seulement utilisée dans des laboratoires de recherche, mais aussi dans le cloud. Si OCI réalise ces plans, la CPU NVIDIA pourrait devenir une nouvelle solution pour les entreprises souhaitant valider des agents, exécuter des charges de raisonnement ou déployer des services d’IA avec une architecture adaptée aux longues durées et à l’utilisation intensive d’outils.

NVIDIA positionne Vera dans une stratégie de co-conception plus large, aux côtés de Rubin GPU, BlueField-4 DPU, Spectrum-X et de l’architecture MGX. Outre son fonctionnement comme CPU autonome, Vera sera le processeur hôte de Vera Rubin NVL72, où il sera connecté aux GPUs Rubin via NVLink-C2C. Ces systèmes partageront une architecture mémoire unifiée pour optimiser l’utilisation du calcul accéléré.

L’IA agissante exige une infrastructure différente

L’arrivée de Vera confirme une tendance perceptible dans les annonces récentes de NVIDIA et Dell : l’IA en entreprise ne se résume plus uniquement aux GPU. La performance réelle dépendra de la coordination entre CPU, GPU, mémoire, réseau, stockage, sécurité et logiciels d’orchestration. Un agent qui génère du code, teste, consulte la documentation interne et réessaie plusieurs fois nécessite une infrastructure différente de celle d’un simple chatbot.

Cela explique pourquoi NVIDIA insisite sur des tâches telles que l’appel à des outils, le sandboxing, la récupération de contexte longue, l’analytique, la gestion du cache KV et l’apprentissage par renforcement. Ces charges, moins spectaculaires que l’entraînement d’un grand modèle, peuvent pourtant faire la différence dans l’efficacité d’une usine d’IA. Si la GPU attend que la CPU prépare les données, orchestre les outils ou déplace la mémoire, le coût total par résultat s’alourdit.

Il y a aussi une dimension énergétique. NVIDIA affirme que Vera peut gérer l’orchestration, le contrôle et le mouvement des données pour alimenter les GPU avec une efficacité énergétique du double par rapport à une infrastructure traditionnelle. Bien que cette revendication doive être vérifiée par des benchmarks indépendants et dans des charges réelles, elle répond à une préoccupation centrale du secteur : l’IA consomme de plus en plus d’énergie, et chaque amélioration en efficacité se traduit par une réduction des coûts opérationnels et une pression moindre sur les data centers.

Pour les hyperscalers, une CPU de ce type peut s’intégrer dans des services d’IA gérés, des plateformes d’agents, des entraînements par renforcement, de l’analyse de données ou dans des environnements où cohabitent modèles, outils et bases de données. Pour les entreprises, l’intérêt réside dans la possibilité que Vera soit déployée dans des serveurs, racks et clouds commerciaux, à un prix raisonnable et selon une disponibilité accessible.

Ce mouvement revêt également une dimension stratégique face à la concurrence. NVIDIA ne se limite pas à vendre des accélérateurs ; avec Vera, elle étend sa présence vers la CPU du centre de données, un domaine historiquement dominé par Intel et AMD, et ce, non pas dans l’informatique générale, mais pour répondre à une demande ciblée : l’IA agissante. Cette spécialisation peut constituer un avantage si le marché adopte massivement des agents, mais inquiète aussi par la dépendance à une promesse qui doit encore devenir réalité dans des déploiements à grande échelle.

Vera ne remet pas en cause l’importance des GPU. Au contraire, elle renforce l’idée que les systèmes d’IA avancée seront de plus en plus intégrés. La CPU orchestre, coordonne et soutient ; la GPU accélère les calculs ; le réseau connecte ; le stockage fournit les données ; et les couches de sécurité protègent modèles, contexte et exécution. Le centre de données se rapproche moins d’une simple somme de composants, et ressemble davantage à une machine conçue pour générer en continu de l’intelligence.

Remettre sur le marché les premiers systèmes à OpenAI, Anthropic, SpaceXAI et Oracle ne garantit pas la réussite commerciale de Vera en soi. Mais cela indique clairement la direction que souhaite prendre NVIDIA : passer de la GPU en tant que produit phare à une plateforme complète d’usines d’IA. Dans l’ère des agents, le composant qui organise le travail pourrait être aussi crucial que celui qui fournit la réponse.

Questions fréquentes

Qu’est-ce que NVIDIA Vera ?
NVIDIA Vera est la première CPU personnalisée de NVIDIA, conçue spécifiquement pour l’IA agissante, l’apprentissage par renforcement, l’orchestration d’outils, les sandboxes, l’analytique et les flux de données dans les usines d’IA.

Pourquoi Vera est-elle importante si l’IA repose principalement sur les GPU ?
Parce que les agents d’IA ne dépendent pas uniquement du calcul des modèles. Ils exécutent aussi du code, consultent des outils, gèrent du contexte, déplacent des données et coordonnent les flux de travail, des tâches où la CPU joue un rôle essentiel.

Quelles entreprises ont reçu les premiers systèmes Vera ?
D’après NVIDIA, les premiers systèmes ont été livrés à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure.

Vera remplace-t-elle les GPU de NVIDIA ?
Non. Vera complète les GPU. Elle peut fonctionner comme CPU autonome ou comme processeur hôte dans des plateformes comme Vera Rubin NVL72, où elle travaille en partenariat avec les GPUs Rubin et d’autres composants réseau et sécurité.

via : blogs.nvidia

le dernier