Dans un monde où l’intelligence artificielle progresse à une vitesse fulgurante, NVIDIA a dévoilé sa feuille de route ambitieuse qui pourrait transformer à jamais le paysage de la computation d’entreprise. La société de Santa Clara prévoit, dans les prochaines années, le lancement d’architectures révolutionnaires nommées Rubin, Rubin Ultra et Feynman, intégrant des technologies de rupture telles que la photonique sur silicon pour créer des systèmes jusqu’à 14 fois plus rapides que celles d’aujourd’hui, d’ici 2027.
Lors de la conférence GTC 2025, le PDG Jensen Huang a présenté une vision qui semble tout droit sortie de la science-fiction : bâtir des « usines d’IA » capables de connecter des millions de GPU avec une consommation d’énergie considérablement réduite. Une réponse claire aux exigences croissantes des modèles d’IA générative qui transforment plusieurs industries.
L’évolution technologique proposée par NVIDIA se manifeste par une progression impressionnante des performances. En 2025, les systèmes Blackwell Ultra B300 NVL72 offriront 1,1 exaflops de puissance FP4, marquant le début de cette course. En 2026, la génération Vera Rubin NVL144 triplera cette performance, atteignant 3,6 exaflops, avec 1,2 exaflops pour l’entraînement FP8. Enfin, en 2027, Rubin Ultra NVL576 culminera avec une puissance de 15 exaflops pour l’inférence et 5 exaflops pour l’entraînement, multipliant par 21 la puissance des systèmes actuels.
Les architectures Rubin, nommée en hommage à Vera Rubin, astronome ayant découvert la matière noire, introduit des innovations majeures avec des rendements exceptionnels : 50 pétaflops par GPU en FP4, une mémoire HBM4 de 288 Go, un large bande passante mémoire de 13 To/s, et un nombre accru de cœurs CPU et de connexions NVLink. Rubin Ultra, quant à lui, représente une véritable bête de somme avec 576 GPU par rack, intégrant la technologie de chiplets, une mémoire HBM4e d’1 To par GPU, une consommation de 600 kW par rack, et plus de 2,5 millions de composants par système, avec un débit NVLink de 1,5 PB/s.
Au-delà, NVIDIA annonce que l’architecture suivante, Feynman, portera le nom du physicien Richard Feynman, suggérant des avancées potentielles dans la physique quantique ou d’autres domaines fondamentaux.
Un autre changement radical concerne la photonique sur silicon, où NVIDIA introduit des commutateurs basés sur la photonique intégrée co-empaquetée (CPO), promettant de révolutionner les réseaux des datacenters. Avec des transceivers Spectrum-X et Quantum-X, ces solutions offrent une efficacité énergétique accrue, une résilience renforcée, une meilleure intégrité du signal, ainsi qu’une vitesse de déploiement supérieure, réduisant également le besoin en lasers.
La technologie des micro-anneaux (MRM) joue un rôle clé dans cette avancée, permettant une modulation ultra efficace de la lumière, compacte et à faibles pertes, avec un potentiel de connexion dépassant de loin les transceivers traditionnels. Un seul switch Quantum-X intègre 18 moteurs photoniques en silicium, 324 connexions optiques, et des liens de données à 200 Gb/s par moteur.
Face à cette révolution, la compétition ne reste pas inactive. AMD accélère ses propres plans avec des CPU EPYC « Summer » et des accélérateurs Instinct MI500X, visant à rivaliser directement avec Rubin Ultra dès 2027. La société prévoit également une nouvelle génération de systèmes avec des performances dix fois supérieures à la génération actuelle.
Intel lutte pour maintenir sa pertinence sur le marché de l’IA, avec des produits tels que Gaudi 3, Xeon de 5e génération et l’écosystème OneAPI, mais ses parts de marché risquent de rester faibles en 2024. Par ailleurs, des acteurs spécialisés comme Cerebras, SambaNova, ou encore des géants du cloud comme Google, Amazon et Microsoft, poursuivent leur développement dans ce domaine hautement concurrentiel.
Le succès de cette révolution dépend aussi d’un écosystème serré de partenaires tels que TSMC, Coherent, Lumentum, Foxconn, Corning, Senko et Sumitomo, qui fournissent les composants nécessaires à ces technologies avancées.
Cependant, ces progrès s’accompagnent de défis importants, notamment en termes de consommation énergétique : un seul rack Rubin Ultra consommera environ 600 kW, l’équivalent de la consommation électrique de quelque 400 foyers. La durabilité énergétique de ces superordinateurs soulève dès lors des questions fondamentales.
Le PDG Jensen Huang insiste toutefois : « Vos revenus sont limités par l’énergie ». La question de la rentabilité dans l’économie des data centers se trouve bouleversée par ces innovations massives.
Ces avancées promettent aussi de démocratiser les capacités de l’IA, permettant l’exécution de modèles plus sophistiqués en temps réel, de réduire considérablement les coûts d’inférence, et d’étendre l’entraînement distribué à des échelles auparavant inimaginables. La société prévoit également un impact sociétal profond, avec des progrès en médecine, en changement climatique et en découvertes scientifiques.
Toutefois, ces ambitions comportent des risques liés à la complexité de fabrication, la disponibilité limitée des matériaux de haute performance, et les enjeux géopolitiques liés à la dépendance à certains fournisseurs comme TSMC ou à la réglementation export. La tension commerciale mondiale pourrait peser sur cette course, alors que des acteurs comme Huawei développent des alternatives nucléaires.
Au final, la feuille de route de NVIDIA jusqu’en 2027 esquisse un avenir où l’intelligence artificielle deviendra une infrastructure essentielle de la société moderne. La puissance de calcul quadruplée et voire décuplicée que promet la société n’est pas simplement une amélioration, mais un saut quantique susceptible de redéfinir tout ce qui semblait impossible. Reste à savoir si le monde sera prêt à gérer cette avalanche de progrès, dans une optique durable et équitable, ou si cette révolution technologique creusera davantage les inégalités.
Les systèmes Rubin Ultra NVL576 devraient être accessibles dans la seconde moitié de 2027, marquant le début d’une nouvelle ère dans la computation d’entreprise — une période où la définition même de « impossible » sera irrémédiablement transformée.