Nvidia accusée de collecter des millions de vidéos quotidiennes pour entraîner son IA

Nvidia accusée de collecter des millions de vidéos quotidiennes pour entraîner son IA

Nvidia fait face à de graves accusations concernant la collecte massive de vidéos en ligne dans le but de former ses modèles d’intelligence artificielle. Selon un rapport de 404 Media, un ancien employé anonyme de la société a révélé que Nvidia utilisait ces vidéos non seulement pour la recherche, mais aussi pour améliorer des produits commerciaux tels qu’Omniverse, son générateur de mondes 3D, et des systèmes de véhicules autonomes. L’entreprise aurait instruit plusieurs employés de télécharger des vidéos, soulevant des inquiétudes quant à la légalité et à l’éthique de cette pratique.

Ming-Yu Liu, vice-président de la Recherche chez Nvidia, a affirmé que ces activités avaient une « approbation exécutive », bien que la controverse persiste. La compagnie semble étendre son rôle au-delà du matériel IA vers le développement de modèles fondamentaux en utilisant de grands volumes de données. Nvidia a indiqué qu’elle construisait une infrastructure capable de générer des données d’entraînement équivalentes à une expérience visuelle humaine de toute une vie par jour.

La controverse s’inscrit dans un contexte plus large de litiges juridiques concernant la collecte de données pour l’IA, qui affecte des entreprises telles qu’OpenAI et Stability AI. Alors que le débat sur la légalité de l’utilisation des données pour former l’IA continue, Nvidia travaille à consolider sa position sur un marché hautement compétitif. La législation entourant ces pratiques est toujours en cours de développement, avec des propositions telles que l’AI Foundation Model Transparency Act au Congrès.

Le projet d’IA de Nvidia, connu sous le nom de Cosmos, a débuté en février 2024 et a déjà collecté jusqu’à présent 38,5 millions d’URL, avec un pourcentage significatif issu de vidéos cinématographiques. En l’absence d’une réglementation claire, Nvidia semble accélérer son développement dans un domaine juridiquement incertain.