NVIDIA et Dell placent l’IA générative au cœur du centre de données

NVIDIA et Dell placent l'IA générative au cœur du centre de données

Jensen Huang a encore une fois utilisé une image puissante pour illustrer le moment actuel de l’intelligence artificielle d’entreprise. Lors de Dell Technologies World, le PDG de NVIDIA a affirmé que la demande « a pris une trajectoire parabole », résumé qui reflète la transition de Dell et NVIDIA : l’IA ne se limite plus […]

Meta achète des millions de cœurs Graviton à AWS pour accélérer son IA générative

Meta achète des millions de cœurs Graviton à AWS pour accélérer son IA générative

Meta a signé un accord avec Amazon Web Services pour intégrer des dizaines de millions de cœurs AWS Graviton dans son infrastructure informatique. Cette initiative renforce une tendance qui commence à prendre de l’ampleur dans le secteur : l’intelligence artificielle ne dépend plus uniquement des GPU. À mesure que les modèles deviennent des systèmes capables […]

Z-Image, le nouveau modèle d’images qui défie le « plus grand, c’est mieux » dans l’IA générative

Z-Image, le nouveau modèle d'images qui défie le « plus grand, c'est mieux » dans l'IA générative

Le paysage de la génération d’images par intelligence artificielle est principalement dominé par de grands modèles propriétaires, comptant plusieurs dizaines de milliards de paramètres et nécessitant une puissance de calcul difficile à soutenir en dehors des hyperscalers. Dans ce contexte, émerge Z-Image, un modèle ouvert de 6 milliards de paramètres qui privilégie une approche pragmatique […]

IBM achète Confluent pour 11 milliards de dollars : ainsi veut-il construire la « plateforme de données intelligente » pour l’ère de l’IA générative

IBM achète Confluent pour 11 milliards de dollars : ainsi veut-il construire la « plateforme de données intelligente » pour l'ère de l'IA générative

IBM frappe fort en le secteur de l’intelligence artificielle d’entreprise avec une nouvelle acquisition stratégique. La société a annoncé la signature d’un accord définitif pour racheter Confluent, pionnier du streaming de données, pour 11 milliards de dollars (31 dollars par action, en cash). Cette opération vise à créer une plateforme « smart data » dédiée […]

Moeve s’associe avec Mistral AI pour mener l’IA générative au cœur du secteur énergétique

Moeve s'associe avec Mistral AI pour mener l'IA générative au cœur du secteur énergétique

La société d’énergie Moeve a conclu un partenariat stratégique avec Mistral AI, l’un des acteurs européens majeurs en intelligence artificielle générative, afin d’accélérer la digitalisation de ses opérations industrielles et de renforcer sa souveraineté technologique en Europe. Cet accord vise à développer des solutions d’IA qui améliorent l’efficacité énergétique, la productivité et la prise de […]

Red Hat et AWS s’associent pour réduire les coûts et faire évoluer l’IA générative dans le cloud

Red Hat et AWS s'associent pour réduire les coûts et faire évoluer l'IA générative dans le cloud

Red Hat annonce avoir renforcé sa collaboration avec Amazon Web Services (AWS) afin de rendre l’inférence des modèles d’intelligence artificielle générative à grande échelle plus efficace et économique. La société open source souhaite permettre aux entreprises d’exécuter leurs modèles d’IA « sur n’importe quel matériel », en s’appuyant désormais également sur les puces spécifiques d’AWS […]

IBM et Groq s’associent pour mettre l’IA générative en production : watsonx Orchestrate ajoutera une inférence « ultrarapide » via LPU et GroqCloud

IBM et Groq s'associent pour mettre l'IA générative en production : watsonx Orchestrate ajoutera une inférence « ultrarapide » via LPU et GroqCloud

IBM et Groq ont annoncé une alliance stratégique en marketing et technologie, avec un objectif clair : permettre aux entreprises de passer des pilotes à la production en IA agentique, sans rencontrer les obstacles habituels liés à la latence, au coût et à l’échelle. L’accord intègre GroqCloud — la plateforme d’inférence accélérée par la LPU […]

Qualcomm présente AI200 et AI250 : accélérateurs « rack-scale » pour l’inférence générative avec plus de mémoire, un TCO réduit et une augmentation de la bande passante effective

Qualcomm présente AI200 et AI250 : accélérateurs « rack-scale » pour l'inférence générative avec plus de mémoire, un TCO réduit et une augmentation de la bande passante effective

Qualcomm a fait une avancée significative dans la course à l’inférence IA à l’échelle des centres de données. La société a annoncé les solutions AI200 et AI250, deux plateformes d’accélération vendues sous forme de cartes ou de racks complets, promettant un rendement à l’échelle du rack, une capacité mémoire accrue et un coût total de […]