
Red Hat et AWS s’associent pour réduire les coûts et faire évoluer l’IA générative dans le cloud
Red Hat annonce avoir renforcé sa collaboration avec Amazon Web Services (AWS) afin de rendre l’inférence des modèles d’intelligence artificielle générative à grande échelle plus efficace et économique. La société open source souhaite permettre aux entreprises d’exécuter leurs modèles d’IA « sur n’importe quel matériel », en s’appuyant désormais également sur les puces spécifiques d’AWS : Inferentia2 et Trainium. Ce partenariat vise un objectif clair : permettre aux dirigeants informatiques et responsables d’infrastructure de déployer l’IA générative en production sans que les coûts liés aux GPU ne deviennent un obstacle, ni limiter ces expérimentations au seul laboratoire. IA générative, oui, mais sans exploser le budget L’explosion de l’IA générative a multiplié les besoins en puissance de calcul pour l’inférence. Chaque




