Arista porte Ethernet à 1,6 Tbps pour les réseaux d’IA à l’échelle de rack

Arista présente la série R4 : 800G en grande, HyperPorts de 3,2 Tb/s et chiffrement par port pour les centres de données et l'IA

Arista Networks a présenté la série 7060XE7, une nouvelle famille de plateformes Ethernet disposant d’une capacité de 1,6 Tbps, conçue pour les réseaux d’intelligence artificielle à haute densité. L’entreprise souhaite répondre à une réalité qui influence désormais la conception des grands centres de données : à mesure que les charges d’entraînement et d’inférence augmentent, passant de milliers à des centaines de milliers d’accélérateurs, le réseau ne se limite plus à être une couche indépendante, mais devient une composante intégrée du système de calcul lui-même.

Cette annonce enrichit la famille Etherlink d’Arista et place la société au cœur d’un des débats techniques majeurs du moment : comment concevoir des réseaux ouverts, efficaces et prévisibles pour des clusters d’IA massifs. La demande ne se limite plus simplement à connecter des serveurs. Les nouvelles infrastructures doivent pouvoir transporter d’énormes volumes de données entre XPUs, GPU, NIC, mémoire et systèmes de stockage, avec une faible latence, une gestion de la congestion et une consommation énergétique maîtrisée.

Le réseau comme backplane de l’IA

Selon Arista, la série 7060XE7 marque une transition, passant de commutateurs hautes performances à des systèmes complets à l’échelle d’un rack. La société présente ces plateformes comme une base pour les fabrics d’IA à la fois évolutifs (scale-out) et à hautes performances (scale-up), capables de s’adapter à des environnements refroidis par air, par liquide ou hybrides.

Ce changement technologique répond à une pression concrète : dans l’entraînement de grands modèles, le réseau influence directement la durée des opérations. Un lien instable, une congestion mal gérée ou de micro-coupures peuvent impacter des milliers d’accélérateurs et retarder des tâches coûteuses en capacité de calcul. En inférence à grande échelle, la latence et la prévisibilité sont tout aussi essentielles, notamment lorsque des modèles sont déployés pour traiter des millions de requêtes réparties.

Arista affirme que la 7060XE7 est conçue pour fonctionner comme un « AI supersystem » à l’échelle d’un rack, avec une faible latence, un buffer intelligent et des capacités EOS adaptées aux modèles de communication intensifs. Cela inclut le trafic intra-étage et inter-étage, ainsi que des sémantiques de calcul et de mémoire propres aux systèmes d’IA modernes.

Plateforme Configuration Refroidissement Disponibilité prévue Objectif principal
7060XE7-64PS 64 ports de 1,6T Air Q4 2026 Réseaux d’IA à haute capacité en 4U
7060XE7-64PRS 64 ports de 1,6T Air Q4 2026 Flexibilité avec optiques IHS et RHS
7060XE7-64PRS-RV3-L 64 ports de 1,6T Liquide Q1 2027 Clusters de haute densité, sans ventilateurs internes
7060XE7-128PE 128 ports de 800G Air Q1 2027 Compatibilité et déploiements flexibles

Meta, Microsoft et Oracle soutiennent l’approche Ethernet

Arista accompagne ce lancement en mettant en avant plusieurs de ses grands clients cloud et IA. Meta, Microsoft et Oracle sont mentionnés comme exemples de grands opérateurs ayant besoin de réseaux plus denses, efficaces et stables pour leurs prochaines générations d’infrastructure.

Meta souligne la nécessité d’adapter l’infrastructure physique pour supporter une densité accrue et une meilleure efficacité énergétique. Microsoft associe les interfaces Ethernet de 1,6T à la nouvelle vague de clusters IA pour Azure Maia et ses data centers Fairwater. Oracle insiste quant à lui sur l’exigence de réseaux aux performances, au caractère déterministe et à la stabilité robustes pour les fabrics IA utilisant le RDMA.

La mention de ces clients n’est pas anodine. L’Ethernet cherche à se positionner comme une alternative ouverte et opérationnelle par rapport à d’autres technologies d’interconnexion spécialisées. Pour les grands fournisseurs de cloud, la promesse de l’Ethernet réside non seulement dans la bande passante, mais dans la manière de l’opérer : outils connus, standards ouverts, possibilité d’intégrer plusieurs fournisseurs, et compatibilité avec les réseaux de centres existants.

Ce discours prend de l’ampleur alors que les clusters d’IA quittent le stade expérimental pour devenir une infrastructure industrielle. Déployer des dizaines ou centaines de milliers d’accélérateurs nécessite un réseau capable de croître, de se ressaisir après une défaillance et d’être géré avec la même rigueur que le reste de l’infrastructure.

Broadcom, AMD et la montée à 1,6T

La transition vers des réseaux de 1,6 Tbps dépend de plusieurs éléments : semiconducteurs de commutation, NIC, optiques, câblage, refroidissement, logiciels et design physique du rack. Arista indique collaborer avec AMD sur des semiconducteurs de calcul et des NIC de nouvelle génération pour les fabrics IA à l’échelle, en standards ouverts.

L’alliance avec Broadcom occupe également une place centrale. La nouvelle série s’appuie sur Tomahawk 6, le silicium Ethernet de Broadcom doté de 102 Tbps de capacité de commutation. Arista précise qu’elle combine ces capacités à EOS ou à d’autres systèmes d’exploitation réseau ouverts, transformant ainsi ces switches en une sorte de radix unifié à l’échelle du rack, que ce soit en refroidissement air ou liquide.

Un point clé est le support des optiques modulaires linéaires (LPO), qui, selon Arista, pourrait réduire la consommation énergétique de l’interconnexion d’environ 60 %. Dans les data centers IA, ce chiffre est crucial : la dépense énergétique ne se limite pas aux GPU ou accélérateurs, mais inclut également le réseau, le refroidissement, l’alimentation. Toute réduction dans la couche d’interconnexion contribue à améliorer la densité de calcul par kilowatt.

Capacité technique Contribution
Ethernet 1,6T Bande passante accrue par port pour clusters IA à haute densité
Jusqu’à 100 Tbps par système Capacité aggregate pour le trafic intensif entre accélérateurs
Broadcom Tomahawk 6 Silicium Ethernet 102 Tbps
LPO Réduction d’environ 60 % de la consommation d’énergie de l’interconnexion, d’après Arista
SerDes 224G Signalisation à haute vitesse pour des designs denses
Compatibilité avec EOS et Open NOS Flexibilité opérationnelle pour grands cloud providers
Options air/liquide Adaptation aux racks traditionnels et aux clusters de nouvelle génération

EOS intègre l’intelligence opérationnelle pour les fabrics d’IA

La dimension logicielle est aussi cruciale que le hardware. Arista implémente dans la 7060XE7 plusieurs fonctions d’EOS axées sur la résilience, la gestion de la congestion et la stabilité en environnement IA. Parmi celles-ci : Dynamic Load Balancing, Cluster Load Balancing, support pour MRC, Link Layer Retry, PFC-aware DLB, PFC-aware ECN, télémétrie, signalisation de congestion et Fast CNP.

Concrètement, ces fonctionnalités visent à réduire un des problèmes majeurs des réseaux IA : qu’un petit défaut amplifié puisse faire échouer une opération entière. Dans un cluster traditionnel, une dégradation d’un lien peut avoir un impact limité. En revanche, dans un entraînement distribué avec des milliers d’accélérateurs, un problème ponctuel peut ralentir ou bloquer une tâche complète.

MRC, ou Multipath Reliable Connection, a justement pour but d’éviter cet « amplificateur de défaillance ». Link Layer Retry assiste à maintenir la stabilité au niveau physique. La signalisation rapide de congestion permet d’intervenir avant qu’une saturation ne devienne critique. La télémétrie et les diagnostics uniformisés facilitent la détection rapide des problèmes dans des environnements où l’échelle rend difficile l’intervention manuelle.

Arista évoque également NetDI et PDI comme composantes pour le diagnostic et la portabilité. NetDI offre un accès standardisé à la télémétrie et aux diagnostics du dispositif, tandis que PDI gère les détails hardware de bas niveau. Pour les grands opérateurs aux environnements diversifiés, cette uniformité réduit la complexité opérationnelle.

L’IA, une course de réseau aussi

Au cours des dernières années, l’attention pour l’infrastructure IA s’est principalement concentrée sur les GPU, accélérateurs, mémoire HBM et capacité électrique. L’annonce d’Arista rappelle que le réseau est tout aussi déterminant. Sans interconnexion suffisante, les accélérateurs attendent des données. Sans gestion efficace de la congestion, les travaux prennent du retard. Sans optimisation énergétique, la densité en rack est limitée.

La série 7060XE7 répond à un marché où la croissance de l’IA oblige à repenser racks, alimentation, refroidissement et topologies. La mise en avant de plateformes liquides, de systèmes sans ventilateurs internes et de racks ORv3 illustre la façon dont le réseau commence à s’intégrer physiquement dans la conception même du cluster, plutôt que d’être ajouté en tant que couche séparée après coup.

Pour Arista, la stratégie est claire : l’Ethernet doit pouvoir supporter les clusters IA de nouvelle génération, tout en conservant standards ouverts et opération cohérente. La question pour ses clients devient alors pratique : quel compromis entre coût, latence, consommation, fiabilité et facilité de gestion permet d’étendre l’IA sans que le réseau devienne un goulot d’étranglement ?

L’intelligence artificielle n’augmente pas seulement la demande en puces. Elle oblige également à redessiner toute une nouvelle génération de réseaux pour centres de données. Avec la série 7060XE7, Arista veut faire en sorte que le réseau ne soit plus simplement une couche supplémentaire, mais fasse partie intégrante de la performance globale du système IA.

FAQ

Que vient de présenter Arista ?

Arista a présenté la série 7060XE7, une famille de plateformes Ethernet de 1,6 Tbps conçue pour les fabrics d’intelligence artificielle à l’échelle d’un rack.

Quel est l’intérêt des réseaux 1,6T en IA ?

Ils permettent de transporter de gros volumes de données entre accélérateurs, serveurs, mémoire et stockage, avec une faible latence et une haute efficacité, essentiels pour l’entraînement et l’inférence à grande échelle.

Quelles entreprises sont associées à cette annonce ?

Arista cite Meta, Microsoft et Oracle, grands clients cloud et IA, qui travaillent avec leurs plateformes pour faire évoluer les infrastructures de nouvelle génération.

Quand seront disponibles ces nouvelles plateformes ?

Les modèles 7060XE7-64PS et 7060XE7-64PRS sont prévus pour le quatrième trimestre 2026. Les versions 7060XE7-64PRS-RV3-L et 7060XE7-128PE sortiront au premier trimestre 2027.

Sources : arista

le dernier