Mistral lance Pixtral Large : le modèle multimodal qui redéfinit les normes de l’IA

Mistral lance Pixtral Large : le modèle multimodal qui redéfinit les normes de l'IA

La startup française Mistral AI a franchi une étape significative dans le monde de l’intelligence artificielle avec le lancement de Pixtral Large, un modèle multimodal de 124 milliards de paramètres. Ce système se positionne comme l’un des plus avancés du marché, offrant des capacités de pointe dans la compréhension de textes, d’images, de graphiques et de documents complexes, surpassant des modèles comme GPT-4o et Gemini 1.5 Pro dans des tests clés.

Pixtral Large : innovation en compréhension multimodale

Pixtral Large se distingue par sa capacité à traiter simultanément jusqu’à 30 images haute résolution ou un livre de 300 pages, grâce à sa fenêtre contextuelle étendue de 128 000 jetons. Ce modèle, basé sur le succès de Mistral Large 2, combine un encodeur de vision d’un milliard de paramètres et un décodeur multimodal de 123 milliards de paramètres, maintenant son avance dans les tâches textuelles tout en étendant son domaine aux données visuelles complexes.

Parmi les réalisations remarquables du modèle figurent :

  • MathVista : 69,4 % de précision en raisonnement mathématique visuel, dépassant tous les modèles actuels.
  • DocVQA et ChartQA : Meilleure performance en compréhension de documents et de graphiques par rapport à GPT-4o et Gemini 1.5 Pro.
  • MM-MT-Bench : Leader dans cette évaluation conçue pour mesurer la performance dans des cas réels d’utilisation multimodale.

Le Chat : un espace de travail complet propulsé par Pixtral Large

La plateforme Le Chat de Mistral a également reçu d’importantes mises à jour, se transformant en un environnement complet pour la création et la gestion de contenu. Parmi les nouveautés marquantes, on retrouve :

  • Recherche Web intégrée.
  • Analyse avancée de documents.
  • Génération d’images, grâce à la technologie Flux Pro de Black Forest Labs.
  • Canvas : un outil pour la création et l’édition de contenu en temps réel, similaire à ceux proposés par OpenAI et Anthropic.

Durant sa phase beta, ces fonctionnalités seront disponibles gratuitement, ce qui permet aux utilisateurs d’expérimenter avec des capacités de dernière génération sans barrières économiques.

Disponibilité et licences

Pixtral Large est disponible sous deux types de licences :

  • Licence de recherche de Mistral (MRL) : pour un usage académique et éducatif.
  • Licence commerciale : pour des essais, le développement et des applications commerciales.

Le modèle peut être testé directement sur la plateforme Le Chat, téléchargé depuis le site officiel de Mistral, ou intégré via son API comme pixtral-large-latest.

Impact sur le paysage mondial de l’IA

Avec ce lancement, Mistral se positionne comme un concurrent sérieux dans un marché historiquement dominé par des entreprises américaines. En offrant des modèles open source et accessibles, la société française souligne son engagement pour une IA plus inclusive et collaborative, marquant un changement dans la dynamique concurrentielle du secteur.

Pixtral Large ne renforce pas seulement le leadership de Mistral dans le développement de modèles multimodaux, mais montre également comment l’innovation européenne peut défier les géants technologiques, en offrant des solutions avancées pour des cas d’utilisation réels dans des secteurs comme la finance, la santé, la recherche et plus.

Mistral Large 24.11 : améliorations continues en compréhension textuelle

En plus de Pixtral Large, Mistral a lancé une mise à jour de son modèle textuel phare, Mistral Large 24.11, maintenant disponible sur des plateformes telles que Google Cloud et Microsoft Azure. Ce modèle améliore la compréhension des contextes longs, introduit un système d’invitations optimisé et des fonctionnalités plus précises, ce qui le rend idéal pour les flux de travail d’entreprise tels que l’automatisation des tâches et l’exploration des connaissances.

Avec Pixtral Large et Mistral Large 24.11, Mistral AI réaffirme son engagement pour l’innovation en intelligence artificielle, offrant des outils puissants et accessibles qui promettent de transformer la manière dont nous interagissons avec des données complexes dans plusieurs formats.

source : Noticias Inteligencia Artificial

le dernier