Oracle a annoncé aujourd’hui la disponibilité générale de HeatWave GenAI, une innovation qui présente les premiers modèles de langue de grande taille (LLM) intégrés dans une base de données et un magasin vectoriel automatique, marquant un jalon dans l’industrie. Avec ces nouvelles capacités, les clients peuvent développer des applications d’intelligence artificielle générative sans avoir besoin d’expérience préalable en IA, sans déplacer des données et sans coûts supplémentaires.
Innovations Clés de HeatWave GenAI
HeatWave GenAI permet aux développeurs de créer un magasin vectoriel pour le contenu d’entreprise non structuré avec une simple commande SQL, en utilisant des modèles d’encastrement intégrés. De plus, il facilite la recherche en langue naturelle en une seule étape, en utilisant des LLM intégrés dans la base de données ou externes, sans nécessité de déplacer des données hors de la base de données. Grâce à l’échelle et la performance extrême de HeatWave, il n’est pas nécessaire de provisionner des GPUs, ce qui réduit la complexité des applications, augmente la performance, améliore la sécurité des données et diminue les coûts.
«HeatWave continue de surprendre avec son rythme d’innovation, maintenant avec l’inclusion de HeatWave GenAI dans nos capacités existantes», a commenté Edward Screven, architecte en chef d’entreprise chez Oracle. «Les améliorations intégrées et automatisées de l’IA permettent aux développeurs de construire des applications d’IA génératives rapidement et facilement, sans nécessiter d’expérience en IA ni de déplacer des données».
Avantages Compétitifs et Performance Exceptionnelle
Selon des benchmarks indépendants, HeatWave GenAI est 30 fois plus rapide que Snowflake, 18 fois plus rapide que Google BigQuery et 15 fois plus rapide que Databricks dans le traitement vectoriel, offrant en outre un coût significativement plus bas. Ces résultats soulignent l’efficacité et la performance supérieure de HeatWave GenAI par rapport à ses concurrents.
Vijay Sundhar, PDG de SmarterD, a affirmé : «HeatWave GenAI simplifie énormément l’utilisation de l’IA générative. L’intégration des LLM dans la base de données et la création de vecteurs dans la base de données réduisent significativement la complexité des applications et améliorent la productivité sans coûts supplémentaires».
Nouvelles Fonctionnalités Automatisées
- LLM en Base de Données : Facilitent le développement d’applications d’IA génératives à moindre coût, permettant des recherches de données, la génération ou le résumé de contenu, et la génération augmentée par récupération (RAG) au sein du HeatWave Vector Store.
- Magasin Vectoriel Automatisé : Les clients peuvent utiliser l’IA générative avec leurs documents d’entreprise sans nécessité de déplacer des données vers une base de données vectorielle séparée, en automatisant tous les étapes nécessaires.
- Traitement Vectoriel à l’Échelle : Offre des résultats de recherche sémantique extrêmement rapides et précis, en utilisant une architecture à l’échelle et une représentation hybride en mémoire qui permet un traitement vectoriel à des vitesses proches de la mémoire.
- HeatWave Chat : Un complément de Visual Code pour MySQL Shell qui fournit une interface graphique pour HeatWave GenAI, permettant des requêtes en langue naturelle ou SQL, tout en maintenant le contexte et les citations des documents sources.
Impact et Collaborations
Le vice-président d’AMD, Dan McNamara, a exprimé son enthousiasme pour la collaboration continue avec Oracle : «Le travail conjoint entre AMD et Oracle permet aux développeurs de concevoir des solutions innovantes d’IA d’entreprise en profitant de HeatWave GenAI et des processeurs AMD EPYC».
HeatWave reste positionné comme le seul service dans le nuage qui offre de l’IA générative automatisée et intégrée avec du machine learning dans une seule offre pour des transactions et des analyses à l’échelle de lakehouse. Disponible de manière native sur OCI et Amazon Web Services, et sur Microsoft Azure via Oracle Interconnect for Azure, HeatWave continue de propulser l’innovation et l’efficacité dans la gestion des données et des applications d’IA dans le nuage.