Red Hat AI Factory avec NVIDIA accélère le chemin vers une IA de production évolutive

Red Hat AI Factory avec NVIDIA accélère le chemin vers une IA de production évolutive

Red Hat, leader mondial des solutions open source, a lancé Red Hat AI Factory avec NVIDIA, une plateforme logicielle codéveloppée intégrant Red Hat AI Enterprise et NVIDIA AI Enterprise. Cette solution offre une approche complète de l’intelligence artificielle, optimisée pour les organisations déployant des systèmes d’IA à grande échelle. La présentation de Red Hat AI Factory avec NVIDIA renforce la collaboration entre les deux entreprises, accélérant la mise à disposition d’innovations en IA pour les clients professionnels dès aujourd’hui, avec un support dès le premier jour pour les architectures matérielles NVIDIA.

Il est prévu que les dépenses en IA d’entreprise dépassent le billion de dollars d’ici 2029, principalement alimentées par des applications d’IA conversationnelle. Dans ce contexte, les entreprises recherchent des solutions pour gérer efficacement des workflows convoqués à haute densité et répondre à une demande croissante en infrastructure et en inférence IA. La nouvelle plateforme permet aux équipes IT d’optimiser la gestion tant de l’infrastructure traditionnelle que des exigences dynamiques de l’écosystème IA.

Red Hat AI Factory avec NVIDIA accélère l’adoption de l’IA en production en proposant une plateforme complète pour les usines d’IA, fonctionnant sur une infrastructure informatique accélérée qui améliore les performances des modèles et des GPU NVIDIA responsables du traitement de l’inférence. La plateforme est compatible avec l’infrastructure d’usine d’IA de fournisseurs leaders comme Cisco, Dell Technologies, Lenovo et Supermicro, facilitant aux responsables TI et aux équipes opérationnelles le déploiement, la montée en charge et la maintenance des solutions IA avec la même fiabilité et rigueur que pour toute charge de travail en entreprise.

Ce logiciel, co-conçu, rassemble l’expertise collaborative en open source, ingénierie et support de Red Hat et NVIDIA pour fournir une solution d’entreprise fiable. Red Hat AI Factory avec NVIDIA constitue une base hautement évolutive pour les déploiements IA dans tous les environnements : sur site, cloud ou edge. Elle inclut des capacités essentielles pour une inférence IA à haute performance, l’ajustement de modèles, la personnalisation, ainsi que le déploiement et la gestion d’agents, tout en mettant l’accent sur la sécurité. Cela permet aux organisations de conserver un contrôle architectural depuis le centre de données jusqu’au cloud public, ce qui se traduit par :

  • Réduction du délai pour obtenir de la valeur : cette solution facilite la transition vers l’IA en production grâce à des workflows optimisés et un accès immédiat à des modèles préconfigurés, notamment la famille IBM Granite avec support juridique, NVIDIA Nemotron et les modèles ouverts NVIDIA Cosmos, déployés sous forme de microservices NVIDIA NIM. Elle permet aussi une meilleure harmonisation des modèles avec les données métier en utilisant NVIDIA NeMo, diminuant ainsi le temps et le coût de tuning.
  • Performance et optimisation des coûts : en maximisant l’utilisation de l’infrastructure et en renforçant la performance des inférences via une stack de services unifiée et performante. Red Hat AI Factory avec NVIDIA offre des capacités d’observabilité intégrées et exploite les inférences Red Hat AI propulsées par vLLM, NVIDIA TensorRT-LLM et NVIDIA Dynamo pour respecter des SLA stricts en matière d’IA. Ainsi, elle aide à réduire le coût total de possession (TCO) en optimisant la connectivité entre modèles et GPU NVIDIA.
  • Orchestration intelligente des GPU : elle facilite l’accès à la demande aux ressources GPU via une orchestration intelligente et une infrastructure en groupe, avec des points de contrôle automatiques pour protéger les traitements longs et assurer une meilleure prévisibilité des coûts en environnement dynamique.
  • Sécurité renforcée pour l’entreprise : En tirant parti de la stabilité et de la flexibilité de Red Hat Enterprise Linux, les organisations bénéficient de capacités avancées en matière de sécurité et de conformité dès le déploiement. Cela contribue à réduire les risques, à économiser du temps et à limiter les interruptions. Cette base robuste en sécurité assure un environnement fiable pour les charges de travail critiques d’IA nécessitant un isolement et une vérification continue. Les microservices NVIDIA DOCA, conçus sur cette architecture, instaurent une stratégie Zero Trust et garantissent une sécurité de l’exécution IA sur l’ensemble de l’infrastructure.

le dernier