Une startup finlandaise lance Root Judge, une IA innovante pour l’évaluation des modèles de langage
Dans un contexte où l’intelligence artificielle générative s’impose dans divers secteurs tels que l’éducation, la santé et l’industrie, des questions subsistent quant à sa fiabilité et sa transparence. La startup Root Signals a réalisé un bond en avant avec le développement de Root Judge, un modèle d’évaluation d’IA spécialement conçu pour mesurer la précision d’autres modèles de langage de grande taille.
Cet avancement a été rendu possible grâce à l’utilisation du superordinateur LUMI, le plus puissant d’Europe, situé à Kajaani, Finlande. Ce projet a reçu le soutien de Business Finland ainsi que des ressources du programme EuroHPC, illustrant ainsi le potentiel de la collaboration publique-privée dans le développement de technologies stratégiques.
Un "juge" de modèles formé avec 400 GPU
Root Judge a été conçu pour détecter les hallucinations (erreurs génératives) dans d’autres LLM et justifier ses évaluations de manière transparente. Pour l’entraîner, l’équipe de Root Signals a exploité presque 400 GPU de LUMI, traitant d’énormes volumes de données synthétiques et ouvertes. Le résultat est un modèle flexible et open source qui surpasse lors des tests d’évaluation d’autres modèles leaders sur le marché, y compris ceux de OpenAI et Anthropic.
« Nous voulions prouver qu’il est possible d’évaluer la qualité d’un modèle d’IA avec un autre modèle spécifiquement conçu à cet effet, et de le faire de manière transparente », déclare Oguzhan Gencoglu, directeur du projet.
Pour faciliter son adoption, l’équipe a choisi de quantifier le modèle afin de réduire ses besoins en ressources, le rendant ainsi accessible aux entreprises dépourvues d’importantes infrastructures matérielles.
LUMI comme catalyseur technologique
Fondée en 2023 à Helsinki, Root Signals a pu accéder aux ressources de LUMI grâce à des financements initiaux. L’équipe a également bénéficié du soutien technique du CSC – IT Center for Science pour surmonter les obstacles et débuter l’entraînement du modèle.
Malgré cela, l’équipe admet que les délais de développement ne s’alignent pas toujours avec les calendriers de financement. « Une plus grande flexibilité dans la durée des projets permettrait de mieux tirer parti des ressources disponibles », souligne Gencoglu.
Croissance, réputation et stratégie open source
Depuis le lancement de Root Judge, l’entreprise a gagné en traction, attirant de nouveaux clients dans des secteurs qui nécessitent la fiabilité des outils basés sur l’IA. Le modèle est proposé en open source et en utilisation commerciale gratuite, consolidant ainsi l’image de Root Signals comme un fournisseur sérieux face aux géants technologiques.
« Nous souhaitions instaurer la confiance. Publier Root Judge en open source a été crucial pour montrer notre savoir-faire », ajoute Gencoglu. Cette décision stratégique n’a pas seulement stimulé la croissance, mais a également établi la startup comme un acteur clé dans le contrôle de la qualité des applications d’IA.
Le prochain défi : une IA capable de raisonnement
En regardant vers l’avenir, Root Signals ne se contente pas du succès de Root Judge. Leur prochain objectif est ambitieux : développer un modèle d’IA capable de raisonnement, capable d’évaluer mais aussi d’expliquer des décisions complexes à la manière de la pensée humaine.
« Personne n’a encore entraîné de modèle évaluateur avec un raisonnement intégré. C’est un défi technique majeur, mais nous pensons que c’est la prochaine étape dans l’évolution de l’IA responsable », conclut Gencoglu.
Avec des projets comme Root Judge, la Finlande et l’Europe renforcent leur engagement vers une intelligence artificielle plus transparente et accessible, soutenue par des infrastructures comme LUMI et une communauté technologique dédiée au code ouvert. Dans un monde de plus en plus dépendant des systèmes automatisés, des outils comme celui-ci feront la différence entre une adoption aveugle et une confiance éclairée.