IBM Cloud intégrera les accélérateurs AMD Instinct MI300X dans sa plateforme pour renforcer les applications d’IA génératives et le calcul haute performance.
IBM et AMD ont annoncé une collaboration stratégique qui permettra l’implémentation des accélérateurs avancés AMD Instinct MI300X en tant que service sur la plateforme IBM Cloud. Ce nouveau service, prévu pour la première moitié de 2025, vise à optimiser la performance et l’efficacité énergétique dans les modèles d’intelligence artificielle générative (IA) et les applications de calcul haute performance (HPC), consolidant ainsi les deux entreprises comme leaders dans les solutions d’entreprise basées sur l’IA.
Technologie au service de l’intelligence artificielle
L’accélérateur AMD Instinct MI300X est conçu pour gérer les demandes des modèles d’IA les plus grands et les plus complexes. Avec une capacité de mémoire de 192 GB de HBM3 (mémoire à haute bande passanteLa bande passante est la capacité maximale de transfert d…), ces accélérateurs sont capables de supporter des inférences et des ajustements de modèles à grande échelle, réduisant la nécessité d’utiliser de multiples GPUs et, par conséquent, les coûts associés.
Alan Peacock, directeur général d’IBM Cloud, a affirmé : “AMD et IBM Cloud partagent une vision commune : outiller les entreprises avec les outils nécessaires pour atteindre leurs objectifs en IA. Avec cette collaboration, nos clients d’entreprise auront une option puissante pour échelonner leurs déploiements d’IA, tout en optimisant coûts et performance.”
De son côté, Philip Guido, vice-président exécutif d’AMD, a souligné : “Alors que les entreprises adoptent des modèles d’IA plus grands et des ensembles de données plus complexes, il est essentiel de disposer d’accélérateurs capables de gérer des charges de travail intensives de manière flexible et efficace. Notre collaboration avec IBM permettra d’exécuter des modèles d’IA générative à grande échelle sans compromettre le coût ou la performance.”
Avantages clés du service
L’intégration des accélérateurs MI300X dans IBM Cloud apportera une série d’avantages conçus pour répondre aux besoins des entreprises de tous les secteurs, y compris les secteurs hautement réglementés :
- Support pour les inférences de modèles de grande taille : Les accélérateurs MI300X offrent la capacité de gérer des modèles avancés et complexes avec plus d’efficacité, réduisant le nombre de GPUs nécessaires.
- Performance améliorée et sécurité optimisée : Via IBM Cloud KubernetesKubernetes (souvent référé en anglais comme “K8s”) … Service et Red Hat OpenShift AI, les utilisateurs pourront exécuter des applications d’IA avec une performance supérieure et garantir la sécurité dans des environnements de cloud hybrides.
- Infrastructure avancée pour l’IA générative : Ce service intégrera les accélérateurs avec la plateforme watsonx AI d’IBM, fournissant aux entreprises des outils supplémentaires pour échelonner leurs charges de travail dans des environnements hybrides.
- Réduction des coûts et de la consommation énergétique : La haute efficacité énergétique des MI300X contribue à minimiser l’impact économique et environnemental des opérations à grande échelle.
Impact sur l’industrie entrepreneuriale
Le déploiement de ces accélérateurs dans IBM Cloud marque une étape importante dans l’évolution du calcul dans le cloud. Ce service permettra aux entreprises de tirer parti des capacités avancées de l’IA générative et du HPC pour transformer des processus et optimiser des opérations dans des domaines clés tels que la finance, la santé, la manufacture et la technologie.
En outre, IBM Cloud assure que cette nouvelle solution sera dotée de ses capacités de sécurité et de conformité réglementaire, essentielles pour les clients dans les secteurs sensibles.
vía: IBM