NVIDIA Vera arrive chez OpenAI, Anthropic et Oracle : le CPU pour l’ère des agents

NVIDIA Vera arrive chez OpenAI, Anthropic et Oracle : le CPU pour l'ère des agents

NVIDIA a commencé la livraison de ses premiers systèmes basés sur Vera, sa nouvelle CPU conçue pour les charges de travail de l’intelligence artificielle agissante. La société confirme que ces premiers équipements ont déjà été remis à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure. Ce n’est pas une CPU supplémentaire dans le catalogue des centres de données : NVIDIA veut en faire le nœud central des usines d’IA, où s’entraînent, s’exécutent et se coordonnent des modèles à grande échelle.

Quand on parle d’IA, l’attention se concentre habituellement sur les GPU. Mais l’intelligence artificielle agissante redistribue les charges au sein des centres de données. Un agent ne génère pas seulement une réponse avant de s’arrêter : il cherche des informations, lance des outils, exécute du code, consulte des bases de données, ouvre des environnements isolés, coordonne plusieurs étapes et maintient un contexte sur de longues sessions. Une grande partie de ce traitement ne se déroule pas dans la GPU, mais autour d’elle. C’est précisément là que NVIDIA veut positionner Vera.

Pourquoi une CPU redevient stratégique dans l’IA

Ces dernières années, le discours autour de l’intelligence artificielle a tourné autour des GPU. NVIDIA a dominé ce marché grâce à ses accélérateurs, ses logiciels et son vaste réseau de développeurs. Mais quand les modèles commencent à fonctionner comme des agents, le goulot d’étranglement ne se limite plus au calcul matriciel. Il apparaît aussi dans l’orchestration, la gestion de la mémoire, les appels aux outils, l’exécution du code, les environnements sandbox, la récupération d’informations et le déplacement de données entre processus.

Vera a été pensée pour ces charges. Selon NVIDIA, elle intègre 88 cœurs Olympus développés en interne, 1,2 téraoctets par seconde de bande passante mémoire et une performance par cœur jusqu’à 50 % supérieure en charge. La CPU est compatible Armv9.2 et gère 176 threads via NVIDIA Spatial Multithreading, une technique qui répartit les ressources physiques du cœur plutôt que d’alterner simplement entre les threads dans le temps.

NVIDIA met aussi en avant la prise en charge jusqu’à 1,5 téraoctets de mémoire LPDDR5X, la connectivité NVLink-C2C de deuxième génération avec 1,8 TB/s de bande passante cohérente, ainsi que des fonctions de Confidential Computing. En pratique, l’objectif est que Vera gère des milliers d’environnements logiciels parallèles et alimente efficacement les flux de données dans des systèmes accélérés, pas seulement qu’elle serve de CPU hôte pour accompagner une GPU.

Caractéristique de NVIDIA VeraDonnées annoncées
Nœuds88 Olympus
Threads176 via Spatial Multithreading
ArchitectureArmv9.2
Bande passante mémoireJusqu’à 1,2 TB/s
Capacité mémoireJusqu’à 1,5 To
NVLink-C2CJusqu’à 1,8 TB/s
Amélioration par cœurJusqu’à 50 % en charge
CompatibilitéSystèmes autonomes, Vera Rubin NVL72, plateformes HGX Rubin

La conclusion qui s’impose : si les agents génèrent davantage d’appels, de code et de requêtes aux données internes, la CPU cesse d’être un composant secondaire. Dans ces charges agissantes, la GPU accélère le modèle, mais c’est la CPU qui orchestre le travail qui lui permet d’opérer efficacement.

Livraisons aux laboratoires d’IA et dans le cloud

Le déploiement initial a une forte portée symbolique. NVIDIA n’a pas annoncé de disponibilité massive, mais des livraisons à certains des acteurs qui fixent le rythme de l’IA : Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure. Ian Buck, vice-président de l’Hyperscale et du High-Performance Computing chez NVIDIA, a personnellement remis les premiers systèmes, selon le blog officiel de la société.

Chez Anthropic, Vera apparaît comme une pièce prometteuse pour les charges agissantes. Chez OpenAI, la livraison répond au besoin d’alimenter de nouvelles charges de travail. Chez SpaceXAI, NVIDIA indique que Vera est évaluée pour l’apprentissage par renforcement et les pipelines de simulation basés sur des agents. Chez Oracle Cloud Infrastructure, l’ambition est plus grande encore : OCI prévoit de déployer des centaines de milliers de CPU NVIDIA Vera à partir de 2026, pour offrir une infrastructure agissante de production à grande échelle.

Ce dernier point est décisif : Vera ne sera pas cantonnée aux laboratoires de recherche, elle entrera dans le cloud. Si OCI réalise ces plans, la CPU NVIDIA pourrait devenir une option standard pour les entreprises qui veulent valider des agents, exécuter des charges de raisonnement ou déployer des services d’IA conçus pour les longues durées et l’utilisation intensive d’outils. C’est la même logique qu’on voit avec des partenariats comme SAP et Google Cloud autour des agents d’entreprise : l’infrastructure se spécialise pour soutenir des flux de travail autonomes.

NVIDIA positionne Vera dans une stratégie de co-conception plus large, aux côtés de Rubin GPU, BlueField-4 DPU, Spectrum-X et de l’architecture MGX. Outre son fonctionnement comme CPU autonome, Vera sera le processeur hôte de Vera Rubin NVL72, connecté aux GPU Rubin via NVLink-C2C. Ces systèmes partageront une architecture mémoire unifiée pour optimiser l’utilisation du calcul accéléré.

L’IA agissante exige une infrastructure différente

L’arrivée de Vera confirme une tendance perceptible dans les annonces récentes de NVIDIA et Dell : l’IA en entreprise ne se résume plus aux GPU. La performance réelle dépend de la coordination entre CPU, GPU, mémoire, réseau, stockage, sécurité et logiciels d’orchestration. Un agent qui génère du code, teste, consulte la documentation interne et réessaie plusieurs fois demande une infrastructure différente de celle d’un simple chatbot.

Voilà pourquoi NVIDIA insiste sur des tâches comme l’appel à des outils, le sandboxing, la récupération de contexte longue, l’analytique, la gestion du cache KV et l’apprentissage par renforcement. Ces charges, moins spectaculaires que l’entraînement d’un grand modèle, peuvent faire la différence dans l’efficacité d’une usine d’IA. Si la GPU attend que la CPU prépare les données, orchestre les outils ou déplace la mémoire, le coût total par résultat augmente.

Il y a aussi une dimension énergétique. NVIDIA affirme que Vera peut gérer l’orchestration, le contrôle et le mouvement des données pour alimenter les GPU avec une efficacité énergétique deux fois supérieure à une infrastructure traditionnelle. Cette revendication reste à vérifier par des benchmarks indépendants, mais elle répond à une préoccupation centrale du secteur : l’IA consomme de plus en plus d’énergie, et chaque gain en efficacité se traduit par une réduction des coûts opérationnels. NVIDIA explore d’ailleurs plusieurs fronts sur ce sujet, comme avec son partenariat avec SPAN pour rapprocher l’infrastructure IA des particuliers.

Pour les hyperscalers, une CPU de ce type peut s’intégrer dans des services d’IA gérés, des plateformes d’agents, des entraînements par renforcement, de l’analyse de données ou des environnements où cohabitent modèles, outils et bases de données. Pour les entreprises, l’intérêt réside dans la possibilité que Vera soit déployée dans des serveurs, racks et clouds commerciaux accessibles.

Cette décision porte aussi une réponse stratégique à la concurrence. NVIDIA ne se limite plus à vendre des accélérateurs ; avec Vera, elle étend sa présence vers la CPU du centre de données, un domaine historiquement dominé par Intel et AMD. Non pas dans l’informatique générale, mais pour répondre à une demande ciblée : l’IA agissante. Cette spécialisation peut constituer un avantage si le marché adopte massivement des agents, mais elle parie sur une promesse qui doit encore prouver sa valeur dans des déploiements à grande échelle.

Vera ne remet pas en cause l’importance des GPU. Elle renforce plutôt l’idée que les systèmes d’IA avancée seront de plus en plus intégrés : la CPU orchestre et coordonne, la GPU accélère les calculs, le réseau connecte, le stockage fournit les données, et les couches de sécurité protègent les modèles, le contexte et l’exécution. Le centre de données ressemble de plus en plus à une machine conçue pour générer en continu de l’intelligence.

Livrer les premiers systèmes à OpenAI, Anthropic, SpaceXAI et Oracle ne garantit pas le succès commercial de Vera. Mais cela indique clairement la direction que NVIDIA veut prendre : passer de la GPU en tant que produit phare à une plateforme complète d’usines d’IA. Dans l’ère des agents, le composant qui organise le travail pourrait être aussi crucial que celui qui fournit la réponse.

Questions fréquentes

Qu’est-ce que NVIDIA Vera ?

NVIDIA Vera est la première CPU personnalisée de NVIDIA, conçue pour l’IA agissante, l’apprentissage par renforcement, l’orchestration d’outils, les sandboxes, l’analytique et les flux de données dans les usines d’IA.

Pourquoi Vera est-elle importante si l’IA repose surtout sur les GPU ?

Parce que les agents d’IA ne dépendent pas uniquement du calcul des modèles. Ils exécutent du code, consultent des outils, gèrent le contexte, déplacent des données et coordonnent les flux de travail, des tâches où la CPU joue un rôle décisif.

Quelles entreprises ont reçu les premiers systèmes Vera ?

D’après NVIDIA, les premiers systèmes ont été livrés à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure.

Vera remplace-t-elle les GPU de NVIDIA ?

Non. Vera complète les GPU. Elle peut fonctionner comme CPU autonome ou comme processeur hôte dans des plateformes comme Vera Rubin NVL72, où elle travaille avec les GPU Rubin et d’autres composants réseau et sécurité.

via : blogs.nvidia.com

le dernier