Oracle et AMD s’associent pour proposer des superclusters IA dans le cloud
Oracle a annoncé une alliance stratégique avec AMD afin d’intégrer la dernière génération des accélérateurs AMD Instinct MI355X dans son infrastructure cloud (Oracle Cloud Infrastructure, OCI). Ce partenariat vise à positionner Oracle en tête du marché de la superinformatique dédiée à l’intelligence artificielle (IA). Le projet inclut un supercluster zettascale, capable d’accueillir jusqu’à 131 072 GPU MI355X, un des plus grands déploiements d’infrastructure IA dans le monde.
Performances et efficacité : les atouts du nouveau supercluster
Cette nouvelle offre, à venir sur OCI, promet un rendement supérieur aux précédentes générations d’AMD, offrant plus du double de performance par rapport à ses prédécesseurs. Les MI355X, dévoilés lors de l’événement Advancing AI à San José, sont construits avec une technologie de 3 nanomètres sur l’architecture CDNA 4. Parmi les caractéristiques principales, on note :
- 288 Go de mémoire HBM3E et un débit de 8 To/s par GPU.
- Jusqu’à 1 400 watts par GPU avec 64 GPU par rack et un refroidissement liquide.
- Support pour le point flottant 4 bits (FP4), essentiel pour l’inférence de modèles génératifs avancés.
- Augmentation de 2,8 fois du débit, tripliant la puissance de calcul par rapport à la génération précédente.
- En comparaison avec NVIDIA Blackwell, AMD affirme que ses MI355X affichent 1,6 fois plus de capacité mémoire et le double de performance FP64.
Une infrastructure ouverte et sans dépendances
Un des éléments marquants de cet accord réside dans l’engagement envers le logiciel open source et la flexibilité pour faire évoluer les projets sans dépendre d’un seul fournisseur. Les clients peuvent ainsi tirer profit du stack ROCm d’AMD, compatible avec les modèles et frameworks les plus connus.
Cette infrastructure est conçue pour couvrir tout le cycle de vie de l’IA, depuis l’entraînement de modèles de langage à grande échelle jusqu’à l’inférence ultra-efficiente pour les applications génératives. Oracle promet des temps d’inférence rapides avec une efficacité énergétique maximisée grâce aux nouvelles CPU AMD Turin.
Concurrence technologique : NVIDIA Blackwell également dans OCI
En parallèle de son annonce avec AMD, Oracle a également lancé son supercluster avec les GPU NVIDIA GB200 NVL72 (Blackwell). Ce déploiement renforce l’offre OCI en matière d’IA et répond à une demande croissante de calcul intensif de la part des entreprises et des gouvernements.
Clients et cas d’utilisation : Seekr choisit Oracle et AMD
Parmi les premiers clients, Seekr a signé un contrat pluriannuel avec OCI pour développer des modèles de langage et de vision, y compris des applications pour satellites et l’analyse de grands volumes de données. Seekr apprécie la scalabilité et la flexibilité qu’offre l’infrastructure Oracle–AMD pour l’optimisation de ses modèles.
Perspectives et concurrence dans le cloud IA
Oracle se positionne comme un pionnier parmi les "hyperscalers", proposant des clusters IA zettascale avec AMD et NVIDIA, élargissant ainsi les options pour les entreprises ayant besoin de puissance de calcul et de flexibilité. En exposant sa volonté d’offrir une infrastructure variée et efficace, Oracle, soutenu par AMD, souhaite démocratiser l’accès à la superinformatique IA face à une demande mondiale en forte croissance.
L’annonce de cette alliance marque un tournant dans la compétition pour la domination technologique dans le domaine de l’intelligence artificielle et de l’infrastructure cloud.