NVIDIA Vera : le CPU maison qui vise 200 milliards dans les centres de données

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

NVIDIA perçoit dans Vera une opportunité à 200 milliards de dollars. Avec son premier CPU maison pour centres de données, l’entreprise s’attaque à un territoire historiquement verrouillé par Intel et AMD — et ne s’en cache pas. Pour le seul exercice en cours, Jensen Huang table sur 20 milliards de revenus CPU.

Ce chiffre mérite d’être mis en perspective. NVIDIA vient de clôturer son premier trimestre fiscal 2027 avec 81,6 milliards de dollars de revenus, en hausse de 85 % sur un an, dont 75,2 milliards imputables aux centres de données. Le deuxième trimestre est prévu à 91 milliards. Le cycle d’investissement en infrastructure IA n’a pas de signe de ralentissement.

Pourquoi les agents IA ont besoin d’un CPU dédié

L’argument de NVIDIA se résume ainsi : un agent IA ne vit pas uniquement dans la GPU. Exécuter du code, appeler des outils, gérer la mémoire, interroger des bases de données, déplacer des contextes, ouvrir des sandbox, orchestrer des étapes — tout ça, c’est du travail CPU. Beaucoup de ces tâches ne peuvent pas être accélérées par des GPU.

Pendant des années, la conversation autour de l’IA portait sur l’entraînement et l’inférence GPU. La phase qui s’ouvre maintenant — des agents capables d’agir sur la durée et de s’intégrer dans les systèmes d’entreprise — exige une autre architecture. C’est là que Vera entre en jeu.

Vera intègre 88 cœurs Olympus maison compatibles Armv9.2, 176 threads via le Spatial Multithreading, jusqu’à 1,2 To/s de bande passante mémoire LPDDR5X et 1,5 To de mémoire supportée. L’interconnexion NVLink-C2C de deuxième génération monte à 1,8 To/s de bande passante cohérente pour travailler avec les futures GPU Rubin.

Caractéristiques de NVIDIA Vera	Données annoncées
Architecture	Armv9.2
Nombre de cœurs	88 Olympus
Threads	176 avec Spatial Multithreading
Bande passante mémoire	Jusqu’à 1,2 To/s
Mémoire supportée	Jusqu’à 1,5 To
Interconnexion	NVLink-C2C de 1,8 To/s
Utilisations principales	IA agentique, RL, analytique, sandboxes, orchestration
Performance par cœur	Jusqu’à 50 % plus rapide sous charge

Jensen Huang le dit directement : les agents n’ont pas vocation à « louer des cœurs », ils veulent que le travail soit fait vite. D’où une CPU à haute performance par cœur, avec beaucoup de mémoire et une intégration étroite avec le reste de l’infrastructure NVIDIA.

De la puce à l’infrastructure complète : la stratégie de verrouillage

Vera ne se vend pas seule. Elle fait partie de l’architecture Vera Rubin, la prochaine grande plateforme NVIDIA pour l’IA à l’échelle du rack. Dans une configuration Vera Rubin NVL72, le CPU agit comme processeur hôte des GPU Rubin et s’intègre avec BlueField-4, Spectrum-X, MGX et les réseaux NVIDIA. L’idée : le centre de données s’achète et s’opère comme une unité, pas comme une somme de composants indépendants.

NVIDIA ne vend plus seulement des puces — elle propose une infrastructure IA complète : GPU, CPU, réseau, DPU, logiciels, bibliothèques, racks, outils pour agents. Plus cette intégration est dense, plus il devient difficile pour un client de remplacer un composant sans toucher au reste. C’est un verrouillage architectural construit méthodiquement, comme l’analysait déjà notre dossier sur NVIDIA et Dell qui placent l’IA générative au cœur du centre de données.

Les premiers systèmes Vera ont été livrés à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure. OCI prévoit de déployer des centaines de milliers d’unités Vera à partir de 2026 pour ses charges agentiques à grande échelle.

Utilisations de Vera	Rôle dans la stratégie
CPU indépendante	Serveurs hautes performances pour IA et analytique
CPU hôte dans Vera Rubin	Alimenter et coordonner les GPU Rubin en racks IA
Vera avec ConnectX-9	Accélérer stockage, sécurité et isolation
Vera pour le cloud	Charges agentiques, sandbox et environnements parallèles
Vera pour entreprises	IA privée et inférence agentique sur infrastructures internes

Pour Intel et AMD, le signal est clair : NVIDIA n’arrive pas sur le marché du CPU généraliste. Elle cible directement le segment où la croissance est la plus forte — l’IA — là où son infrastructure domine déjà.

Les tensions d’approvisionnement, risque réel

NVIDIA reconnaît elle-même le problème : l’approvisionnement. Huang a prévenu que des restrictions de fourniture s’étendront sur toute la durée de vie de Vera Rubin. Vera dépend de mémoire LPDDR5X haut de gamme, d’emballages avancés et de capacités de fabrication déjà sous pression à cause de la demande IA.

La mémoire sera le maillon le plus fragile. Vera doit gérer des milliers d’environnements logiciels en parallèle, maintenir des contextes larges et alimenter en continu les GPU. Or l’industrie vit une forte tension sur la DRAM, la HBM et les mémoires avancées, face à une croissance des centres de données IA qui ne faiblit pas.

La concurrence s’organise aussi. Google, Amazon et Microsoft développent leurs propres accélérateurs pour réduire leur dépendance. AMD pousse ses EPYC et GPU Instinct. Intel cherche à regagner du terrain. Des acteurs comme Groq ciblent des niches précises de l’inférence avec des architectures différentes. NVIDIA souligne que les solutions axées sur le décodage à faible latence resteront de niche : les charges agentiques réelles nécessitent de grands contextes, des modèles complexes et des pipelines variés. Cette dynamique rejoint les tensions que nous décrivions dans notre article sur l’IA d’entreprise face aux contraintes de souveraineté des données.

La CPU retrouve sa place dans l’infrastructure IA

Pendant des années, la CPU semblait perdre du terrain dans le récit de l’IA. La GPU accaparait toute l’attention. Vera montre que la situation est plus nuancée. Quand l’IA passe de la réponse à la réalisation de tâches complexes, la CPU redevient un composant central — non pas à la place de la GPU, mais comme coordinateur du système.

La question pratique pour les clients sera de mesurer le coût par tâche réalisée. Promettre un rendement supérieur par cœur ou une meilleure efficacité énergétique ne suffit pas. Les opérateurs cloud et les entreprises voudront des réponses concrètes : les agents finissent-ils plus vite ? Les GPU attendent-ils moins ? Les sandbox fonctionnent-ils mieux ? Les requêtes de données sont-elles plus rapides ? Et le coût total d’infrastructure baisse-t-il vraiment ?

Si NVIDIA respecte ses engagements, Vera pourrait devenir l’un des lancements les plus importants dans les serveurs depuis plusieurs années — non pas en remplaçant Intel et AMD sur toutes les charges, mais en s’imposant sur le segment qui compte le plus : les centres de données pour l’IA. L’infrastructure IA ne se bâtit pas qu’avec des modèles. Elle se bâtit avec CPU, GPU, mémoire, réseau, refroidissement, énergie et logiciels. NVIDIA maîtrisait déjà la plupart de ces briques. Avec Vera, elle vise la dernière qui lui manquait.

FAQ : NVIDIA Vera et les centres de données IA

Qu’est-ce que NVIDIA Vera ?

Vera est le premier CPU maison de NVIDIA, conçu pour les centres de données IA. Basé sur l’architecture Armv9.2 avec 88 cœurs Olympus, il cible les charges d’IA agentique : orchestration, gestion de contexte, exécution de code, appels d’outils et sandboxes — tout ce que les GPU ne traitent pas efficacement.

Pourquoi NVIDIA lance-t-elle un CPU maintenant ?

L’IA agentique exige de la puissance CPU pour coordonner, orchestrer et alimenter les GPU. NVIDIA veut contrôler cette partie de l’infrastructure, qui représente selon elle un marché potentiel de 200 milliards de dollars. Jensen Huang vise déjà 20 milliards de revenus CPU cette année.

Vera est-elle une concurrente directe d’Intel et AMD ?

Indirectement. NVIDIA ne cherche pas à concurrencer sur les serveurs généralistes. Elle cible les centres de données IA, où ses GPU dominent déjà. Vera complète cette infrastructure en maîtrisant la couche CPU — là où Intel et AMD perdent du terrain face à la demande IA.

Quels clients ont déjà reçu des systèmes Vera ?

Les premières livraisons sont allées à Anthropic, OpenAI, SpaceXAI et Oracle Cloud Infrastructure. OCI prévoit de déployer des centaines de milliers d’unités Vera à partir de 2026 pour des charges agentiques à grande échelle.

Quels sont les principaux risques autour de Vera ?

L’approvisionnement est le premier risque. NVIDIA a prévenu que des restrictions de fourniture s’étendront sur toute la durée de vie de Vera Rubin. La forte tension sur la mémoire LPDDR5X et HBM, combinée à une demande IA qui ne faiblit pas, pourrait limiter les déploiements à grande échelle dans les prochains trimestres.