NVIDIA a révélé une série d’outils avancés d’intelligence artificielle et de simulation qui promettent d’accélérer le développement de robots humanoïdes et d’améliorer les capacités d’apprentissage en robotique. Ces nouveautés, présentées lors de la Conférence sur l’Apprentissage en Robotique (CoRL) à Munich, incluent la disponibilité générale de son cadre d’apprentissage robotique NVIDIA Isaac Lab, six nouveaux flux de travail pour le développement d’humanoïdes dans le Projet GR00T et des outils pour la création de modèles de monde avec des technologies comme NVIDIA Cosmos et NeMo Curator.
NVIDIA Isaac Lab : le cadre d’apprentissage robotique ouvert
NVIDIA Isaac Lab est une plateforme d’apprentissage robotique open source basée sur NVIDIA Omniverse, conçue pour faciliter le développement de politiques de contrôle à l’échelle sur des robots de différentes formes, des humanoïdes aux quadrupèdes. Cette plateforme unifiée permet aux développeurs d’entraîner des modèles d’IA pour des robots capables de gérer des mouvements complexes et des environnements interactifs, accélérant le processus de création d’applications robotiques.
Parmi les grands noms de la robotique qui ont déjà adopté Isaac Lab figurent Agility Robotics, Boston Dynamics et XPENG Robotics. Avec le soutien de cet outil, des entreprises technologiques du monde entier progressent dans leurs projets robotiques de manière plus agile et collaborative.
Projet GR00T : capacités avancées pour les robots humanoïdes
Le Projet GR00T est une initiative de NVIDIA visant à créer un écosystème global de développeurs de robots humanoïdes en fournissant des bibliothèques, des modèles de base et des flux de travail spécifiques pour le développement de robots avancés. Les six flux de travail de GR00T sont conçus pour aider les développeurs d’humanoïdes à surmonter les défis les plus complexes dans ce domaine :
- GR00T-Gen : Génération d’environnements 3D avec IA générative basée sur OpenUSD.
- GR00T-Mimic : Génération de mouvement et de trajectoire pour robots.
- GR00T-Dexterity : Manipulation habile et précise.
- GR00T-Control : Contrôle complet du corps chez les robots.
- GR00T-Mobility : Navigation et locomotion.
- GR00T-Perception : Perception multimodale pour des capteurs avancés.
Jim Fan, responsable de la recherche chez NVIDIA, a souligné que les robots humanoïdes représentent « la prochaine vague d’IA intégrée », et que ces flux de travail sont conçus pour faire face aux exigences technologiques de cette tendance émergente.
Outils avancés pour la création de modèles de monde
La création de modèles de monde — représentations numériques d’environnements qui permettent aux robots de prédire comment interagir avec des objets — est un processus qui nécessite de grandes quantités de données et d’importantes ressources de calcul. Pour relever ce défi, NVIDIA a lancé le tokeniseur Cosmos et le NeMo Curator, deux outils qui optimisent la compression et la curation des données vidéo et d’image.
- NVIDIA Cosmos Tokenizer : Fournit une tokenisation visuelle de haute qualité et efficacité, avec des taux de compression jusqu’à 12 fois supérieurs aux normes actuelles, ce qui permet de développer des applications génératives dans divers domaines visuels.
- NeMo Curator : Optimise le traitement des données vidéo à travers un pipeline automatisé et évolutif, capable de traiter des données sur plusieurs GPU et de gérer jusqu’à 100 pétaoctets d’informations. Cet outil est spécialement conçu pour réduire le temps de développement et les coûts, ce qui profite directement à l’industrie de la robotique.
Eric Jang, vice-président de l’IA à 1X Technologies, a exprimé que le Cosmos Tokenizer permet à l’entreprise de former des modèles de monde plus efficacement, avec une haute compression et une conservation de la fidélité visuelle.
Encourager la communauté d’apprentissage en robotique
NVIDIA a partagé 23 travaux de recherche et organisé neuf ateliers au CoRL, couvrant de l’intégration de modèles de langage visuel aux stratégies de planification de tâches complexes et l’acquisition de compétences par le biais de démonstrations humaines. Deux des progrès les plus remarquables incluent SkillGen, un système basé sur la génération de données synthétiques pour entrainer des robots, et HOVER, un modèle de base pour contrôler la locomotion et la manipulation dans les robots humanoïdes.
De plus, la compagnie favorise la collaboration avec la communauté de développeurs par le biais de partenariats avec Hugging Face et la création de programmes spécifiques comme le NVIDIA Humanoid Robot Developer Program, dans lequel les développeurs peuvent accéder à des ressources exclusives et un soutien spécialisé.
Disponibilité et accès
NVIDIA Isaac Lab 1.2 et le Cosmos Tokenizer sont déjà disponibles sur GitHub et Hugging Face, tandis que NeMo Curator le sera à la fin du mois. NVIDIA lancera également prochainement les nouveaux flux de travail du Project GR00T, accompagnés d’une série de guides et de tutoriels pour aider les développeurs à s’intégrer dans cet écosystème.
Cet ensemble d’outils ne représente pas seulement une avancée technologique, mais aussi une ouverture vers un écosystème de développement plus collaboratif. À travers cette combinaison d’IA et de simulation, NVIDIA cherche à accélérer l’évolution de la robotique et, en particulier, des humanoïdes, marquant la voie vers un futur où les robots seront des compagnons efficaces dans des environnements complexes et en constante évolution.
via : Nvidia et Noticias IA