Renforcement de la collaboration entre Red Hat et AMD lors du Red Hat Summit
Lors du Red Hat Summit, Red Hat et AMD ont annoncé une expansion de leur collaboration stratégique visant à offrir des solutions plus efficaces dans le domaine de l’intelligence artificielle générative et à moderniser les infrastructures virtualisées dans des environnements hybrides. La combinaison des technologies ouvertes de Red Hat avec la puissance des processeurs AMD EPYC et des GPU AMD Instinct vise à optimiser à la fois la performance et l’évolutivité des charges de travail de plus en plus diverses et exigeantes.
AMD Instinct et Red Hat OpenShift AI : une inférence optimisée dans le cloud hybride
L’un des principaux thèmes abordés est l’intégration complète des GPU AMD Instinct dans Red Hat OpenShift AI. Cela permettra aux organisations de déployer des modèles d’intelligence artificielle de manière plus efficace sans nécessiter des ressources extrêmes. Des tests effectués sur Microsoft Azure ont démontré que l’évolutivité des modèles de langage (SLM et LLM) est possible au sein d’une seule machine virtuelle équipée de plusieurs GPU, réduisant ainsi les coûts de performance en évitant la fragmentation des ressources entre plusieurs VM.
Grâce aux GPU AMD Instinct MI300X et à la plateforme Red Hat Enterprise Linux AI, cette collaboration a montré un environnement d’inférence robuste, efficace et compatible avec des architectures ouvertes.
Collaboration sur vLLM : une inférence IA plus efficace avec les GPU AMD
Les deux entreprises ont également annoncé leur travail conjoint dans l’écosystème vLLM (vectorized LLM), contribuant directement au projet en amont pour accélérer l’inférence des modèles de langage. Parmi les améliorations annoncées figurent :
- Améliorations de la performance sur GPU AMD, comprenant l’intégration de la bibliothèque de noyau AMD, l’optimisation du noyau Triton et le support FP8 pour des modèles denses et quantifiés.
- Support amélioré pour les systèmes multi-GPU, permettant une exécution plus évolutive et écoénergétique dans des environnements distribués.
- Élargissement de l’écosystème vLLM, avec la participation d’autres acteurs tels qu’IBM, qui renforcent le développement continu du projet et sa compatibilité avec le matériel AMD.
En conséquence de cette collaboration, les GPU AMD Instinct prendront en charge nativement le Red Hat AI Inference Server, la distribution entreprise de vLLM, facilitant ainsi l’exécution de modèles open source sur du matériel validé et optimisé.
EPYC et OpenShift Virtualization : une modernisation sans frictions
Red Hat a également souligné la validation de Red Hat OpenShift Virtualization pour les processeurs AMD EPYC, permettant aux organisations de centraliser les charges de travail des machines virtuelles et des conteneurs sur une même plateforme cloud native. Cette capacité est essentielle pour moderniser les datacenters traditionnels, rationaliser l’infrastructure et réduire le TCO (coût total de possession) en matière de matériel, de licences et d’énergie.
Les processeurs AMD EPYC se positionnent comme la plateforme idéale pour héberger des systèmes compatibles avec les GPU, améliorant ainsi le retour sur investissement même pour des charges IA hautement exigeantes. Parmi les serveurs compatibles figurent des solutions de Dell PowerEdge, HPE ProLiant et Lenovo ThinkSystem.
Déclarations officielles
Ashesh Badani, vice-président senior et responsable produit chez Red Hat, a déclaré :
« Tirer pleinement parti de l’IA nécessite flexibilité et capacité d’évoluer. Cette collaboration avec AMD élargit les options disponibles pour moderniser les infrastructures et préparer les environnements de production avec des accélérateurs de pointe et des technologies open source. »
Philip Guido, directeur commercial d’AMD, a ajouté :
« La combinaison des plateformes ouvertes de Red Hat avec nos GPU Instinct et nos CPU EPYC offre la performance et l’efficacité dont nos clients ont besoin pour accélérer l’innovation en matière d’IA, de virtualisation et de cloud hybride. »
Source : AMD
Stuxnet, la première cyberarme : comment un ver informatique a changé la guerre moderne