Intel et Aible, une solution d’entreprise complète d’intelligence artificielle générative (GenAI) et d’analyse augmentée sans serveur, ont annoncé de nouvelles solutions pour les clients communs qui permettent d’exécuter des cas d’utilisation avancés de GenAI et de génération augmentée par récupération (RAG) sur plusieurs générations de processeurs Intel® Xeon®. Cette collaboration, qui comprend des optimisations d’ingénierie et un programme de benchmarking, améliore la capacité de Aible à offrir des résultats de GenAI à faible coût pour les clients d’entreprise et aide les développeurs à intégrer l’intelligence artificielle dans leurs applications.
Innovations dans la Performance de GenAI avec Intel Xeon
Les solutions de Aible démontrent comment les CPU peuvent améliorer significativement la performance dans une variété de charges de travail modernes d’IA, depuis l’exécution des modèles de langage jusqu’à la RAG. Optimisées pour les processeurs Intel, la technologie de Aible utilise une approche sans serveur efficace pour l’IA, consommant des ressources uniquement lorsqu’il y a des demandes actives des utilisateurs. Par exemple, la base de données vectorielle s’active seulement pendant quelques secondes pour récupérer des informations pertinentes pour une requête de l’utilisateur, et le modèle de langage s’allume brièvement pour traiter et répondre à la demande. Cette opération à la demande aide à réduire le coût total de possession (TCO).
Bien que la RAG soit généralement mise en œuvre en utilisant des GPU (unités de traitement graphique) et des accélérateurs pour tirer parti de leurs capacités de traitement parallèle, la technique sans serveur de Aible, combinée aux processeurs évolutifs Intel® Xeon®, permet aux cas d’utilisation de RAG d’être complètement pilotés par des CPU. Les données de performance montrent que plusieurs générations de processeurs Intel Xeon peuvent exécuter efficacement les charges de travail de RAG.
Collaboration Stratégique pour l’Efficacité en IA
Mishali Naik, ingénieure principale senior chez Intel dans le Groupe de Centres de Données et d’IA, a souligné : « Les clients recherchent des solutions efficaces et de niveau entreprise pour tirer parti de la puissance de l’IA. Notre collaboration avec Aible montre comment nous travaillons étroitement avec l’industrie pour offrir des innovations en IA et réduire la barrière à l’entrée pour que de nombreux clients exécutent les dernières charges de travail de GenAI en utilisant des processeurs Intel Xeon ».
Réduction des Coûts et Amélioration de l’Efficacité
Aible permet aux clients de réduire les coûts opérationnels des projets GenAI en utilisant exclusivement des CPU en forme sans serveur pour partager de façon plus sécurisée les mêmes ressources informatiques sous-jacentes entre plusieurs clients. Selon l’analyse des benchmarks de Aible, les clients peuvent réaliser jusqu’à 55 fois d’économies de coûts en exécutant des modèles RAG dans leurs solutions sans serveur basées sur des CPU. Cette réduction des coûts est un témoignage de l’efficacité de l’approche unique de Aible, qui évite le besoin d’infrastructures basées sur des GPU plus coûteuses.
Résultats de la Collaboration Intel-Aible
Intel, incluant Intel Labs, a travaillé avec Aible pour optimiser les charges de travail d’IA sur les processeurs Xeon. Notablement, en optimisant le code de Aible pour AVX-512, Aible a vu des gains significatifs en performance et a amélioré sa capacité sur les processeurs Xeon, soulignant l’impact des optimisations stratégiques de logiciel sur l’efficacité générale.
La combinaison des modèles RAG avec les processeurs Intel Xeon, facilitée par des plateformes comme Aible, peut activer des applications telles que :
- Traitement de langage naturel (TALN ou NLP en anglais)
- Systèmes de recommandation
- Systèmes de soutien à la décision
- Production de contenu