Snowflake intègre DeepSeek-R1 à Cortex AI en version préliminaire

Snowflake intègre DeepSeek-R1 à Cortex AI en version préliminaire

Annonce de l’Intégration de DeepSeek-R1 dans Snowflake Cortex AI

Nous sommes ravis d’annoncer l’intégration de DeepSeek-R1 dans Snowflake Cortex AI lors de sa phase préliminaire. Développé par DeepSeek et formé grâce à des techniques d’apprentissage par renforcement (RL) à grande échelle sans ajustement supervisé (SFT), ce modèle rivalise avec OpenAI-o1 dans des domaines clés tels que les mathématiques, la génération de code et le raisonnement. Selon les tests de performance publiés par DeepSeek, DeepSeek-R1 se positionne comme un leader parmi les modèles open source et fait concurrence à certaines des solutions propriétaires les plus avancées sur le marché.

Les clients peuvent désormais demander un accès anticipé à DeepSeek-R1 dans Cortex AI. Durant cette phase préliminaire privée, notre objectif sera d’assurer une expérience conforme à nos principes de facilité, efficacité et confiance.

Le modèle sera disponible en mode sans serveur, permettant des inférences par lots (fonction SQL) ou interactives (Python et API REST). Les personnes intéressées peuvent contacter leur équipe commerciale pour demander un accès à la version bêta, avec une disponibilité limitée à la demande.

Le modèle sera hébergé aux États-Unis, dans le périmètre de service de Snowflake, et nous ne partageons pas les données avec le fournisseur du modèle.

Une fois que le modèle sera disponible au grand public, les clients pourront gérer l’accès à celui-ci à l’aide d’un contrôle d’accès basé sur les rôles (RBAC). Les administrateurs de comptes pourront restreindre l’accès en sélectionnant les modèles approuvés selon les politiques de gouvernance.

Snowflake Cortex AI

Snowflake Cortex AI est un ensemble de fonctionnalités et de services intégrés, comprenant l’inférence LLM entièrement gérée, le fine-tuning et la RAG (Récupération Augmentée Générative) pour les données structurées et non structurées. Cela permet aux clients d’analyser rapidement des données non structurées en parallèle de leurs données structurées et d’accélérer le développement d’applications d’IA. Les clients peuvent accéder à des LLM leaders dans l’industrie, qu’ils soient open source ou propriétaires, et les intégrer facilement dans leurs workflows et applications. Snowflake a adopté l’écosystème open source avec la compatibilité de plusieurs LLM de Meta, Mistral et Snowflake. Nous croyons que cet accès ouvert et cette collaboration faciliteront l’innovation dans ce domaine.

DeepSeek-R1

Selon un article publié par DeepSeek sur GitHub, ils ont directement appliqué l’apprentissage par renforcement au modèle de base sans recourir à un ajustement supervisé préalable. Cette approche a permis au modèle d’explorer la chaîne de pensée (CoT) pour résoudre des problèmes complexes, aboutissant ainsi au développement de DeepSeek-R1-Zero. Ils mentionnent également que le modèle initial a démontré des capacités telles que l’autoverification, la réflexion et la génération de longues chaînes de pensée, tout en rencontrant des défis tels que la répétition infinie, la peu lisibilité et le mélange des langues. Pour surmonter ces problèmes, l’équipe de DeepSeek a intégré des données de démarrage à froid avant le RL pour améliorer les performances de raisonnement.

L’équipe a mis en œuvre un entraînement FP8 à faible précision et une stratégie de répartition de charge sans perte auxiliaire, comporant ainsi des performances à la pointe de la technologie avec des coûts d’entraînement inférieurs.

Utilisation de DeepSeek-R1 dans Cortex AI

Avec Snowflake Cortex AI, accéder à de grands modèles linguistiques est simple. Aucune gestion d’intégrations ou de clés API n’est nécessaire. Les contrôles de gouvernance peuvent être mis en œuvre de manière cohérente sur les données et l’IA. L’accès aux modèles est disponible dans l’une des régions supportées, et il est également possible d’accéder depuis d’autres régions avec l’inférence inter-régionale activée. Cortex Guard peut être activé pour filtrer des réponses potentiellement inappropriées ou non sécurisées. Ces mesures de sécurité renforcent la gouvernance en appliquant des politiques alignées pour filtrer les contenus nuisibles.

Quelles sont les prochaines étapes ?

Selon DeepSeek, il s’agit du premier modèle open source démontrant que les capacités de raisonnement des LLM peuvent être stimulées uniquement par le RL, sans besoin d’un SFT. Cortex AI offre une intégration facile via des fonctions SQL et des API REST, et Cortex Guard permet aux clients de mettre en œuvre les contrôles de sécurité nécessaires. L’équipe de recherche en IA de Snowflake prévoit d’améliorer DeepSeek-R1 afin de réduire davantage les coûts d’inférence. Les clients peuvent réaliser des économies de performance et de coût avec DeepSeek-R1 et accélérer le déploiement d’applications d’IA générative. Cette avancée pave la voie pour de futures innovations dans ce domaine.