Un accord multimillionnaire ouvre un nouveau chapitre dans la course pour dominer l’entraînement des modèles d’intelligence artificielle à grande échelle
Oracle a signé un accord stratégique avec AMD pour déployer un cluster de 30 000 unités de GPU MI355X, renforçant ainsi son engagement à étendre son infrastructure dédiée à l’entraînement de modèles d’intelligence artificielle. L’annonce a été faite par Larry Ellison, CTO d’Oracle, lors de la présentation des résultats du troisième trimestre 2025, qualifiant ce contrat de « multimillionnaire ».
Les nouveaux GPU d’AMD, fabriqués avec le nœud de 3 nm de TSMC et basés sur l’architecture CDNA 4, sont appelés à devenir l’une des alternatives les plus puissantes à la domination actuelle de Nvidia dans le segment de l’informatique accélérée. Chaque unité est dotée de 288 Go de mémoire HBM3E et peut atteindre une largeur de bande allant jusqu’à 8 Tbps, en faisant un concurrent direct des modèles Nvidia B100 et B200.
La conception de ces cartes, qui fonctionnent avec une consommation thermique (TDP) de 1 100 watts, nécessite impérativement des systèmes de refroidissement liquide, soulignant la sophistication technique et les besoins énergétiques de ce type de clusters haute performance.
Où sera situé le cluster ?
Pour l’instant, Oracle n’a pas révélé l’emplacement de ce nouveau cluster de 30 000 GPU, bien que des médias spécialisés comme DCD aient contacté la société pour déterminer si l’infrastructure sera liée au projet Stargate, développé en collaboration avec OpenAI.
Par ailleurs, dans le même trimestre, Oracle a également annoncé un autre jalon en déployant 64 000 GPU Nvidia GB200 pour OpenAI, dans un centre de données situé à Abilene, Texas, loué à l’entreprise Crusoe. Cependant, l’accord avec OpenAI n’a pas encore été formalisé, comme l’a reconnu la société elle-même lors de l’appel de résultats, bien qu’il soit prévu qu’il se conclue prochainement.
AMD renforce sa présence dans les grands déploiements cloud
Ce nouveau contrat n’est pas le premier entre Oracle et AMD. En septembre 2024, Oracle avait déjà choisi les puces AMD Instinct MI300X pour renforcer son OCI Compute Supercluster, une infrastructure pouvant évoluer jusqu’à 16 384 GPU, présentée comme une plateforme concurrentielle face à d’autres offres d’informatique intensive basées sur des GPU.
L’intégration des MI355X non seulement élargit la capacité d’Oracle à rivaliser sur le marché émergent de l’IA générative, mais confirme également l’attrait croissant d’AMD en tant que fournisseur de solutions hautes performances pour les entreprises cherchant à diversifier leur dépendance technologique au-delà de Nvidia.
Une nouvelle phase dans la course à l’entraînement de l’IA
La démarche d’Oracle s’inscrit dans une compétition de plus en plus intense pour contrôler les ressources nécessaires à l’entraînement des modèles d’IA de prochaine génération. À mesure que les demandes computationnelles explosent, tant par la taille que par la complexité des modèles, la disponibilité de matériel spécialisé et efficace est devenue un avantage stratégique.
De plus, les coûts énergétiques élevés et la nécessité de centres de données optimisés pour le refroidissement liquide poussent les acteurs du secteur à chercher des solutions plus durables et puissantes. Avec cet accord, Oracle se positionne comme l’un des principaux acteurs capables d’offrir une puissance de calcul à grande échelle, tant pour sa propre infrastructure que pour les clients de l’écosystème cloud et IA.
Le déploiement prévu des GPU MI355X d’ici mi-2025 représente sans aucun doute un pas en avant dans l’évolution de l’informatique accélérée, avec Oracle et AMD comme alliés clés dans ce nouveau chapitre technologique.
via : DCD