GPUs | Actualite Cloud

Google et NVIDIA rapprochent les clusters d’IA du million de GPUs Rubin

NVIDIA Rubin CPX : le GPU qui redéfinit l'inférence de contexte longue à l'ère de l'IA

Google Cloud et NVIDIA ont renforcé leur partenariat afin de déployer la prochaine génération de GPU Vera Rubin dans l’infrastructure AI Hypercomputer de Google. L’annonce concerne la famille d’instances bare metal A5X, conçue pour des charges de travail en intelligence artificielle agéntique et physics, avec une promesse d’échelle impressionnante : jusqu’à 80 000 GPUs NVIDIA […]

AMD et Meta signent un accord de 6 gigawatts pour déployer des GPUs Instinct et faire évoluer leur infrastructure d’IA

La course à l’Intelligence Artificielle à l’hyper scale est en train de transformer même le langage utilisé par les entreprises technologiques pour décrire leurs investissements. Là où l’on parlait autrefois de “nombre de GPU” ou “nombre de serveurs”, il devient de plus en plus courant d’évaluer les déploiements en termes de puissance électrique. Sur ce […]

AMD et Cohere élargissent leur partenariat pour déployer l’IA d’entreprise et « souveraine » sur des infrastructures avec GPUs Instinct

AMD et Cohere ont franchi une étape supplémentaire dans leur collaboration pour accélérer l’adoption de l’intelligence artificielle dans les entreprises et les administrations publiques. La multinationale des semi-conducteurs et la société canadienne spécialisée en IA « security-first » ont annoncé que les clients de Cohere pourront exécuter North — leur plateforme d’automatisation et d’agents d’entreprise […]

Linux 6.16 arrive avec le support pour Intel TDX, APX, zero-copy avec DMA et des nouveautés clés dans EXT4, XFS et GPUs NVIDIA Hopper

Guide complet pour améliorer la sécurité sous Linux

La nouvelle version du noyau Linux renforce ses performances et sa sécurité pour les environnements modernes de calcul, de virtualisation et de réseaux, tout en élargissant la compatibilité avec le matériel de dernière génération. La communauté du noyau Linux a franchi une étape importante avec le lancement officiel de Linux 6.16, une version qui consolide […]

LM Studio propulse l’IA locale : comment il accélère l’inférence avec les GPUs RTX et CUDA 12.8

LM Studio 0.3.15 : Une Révolution dans l’Exécution Locale des Modèles IA Dans un monde où l’intelligence artificielle générative s’intègre progressivement dans le quotidien des développeurs, chercheurs et utilisateurs avancés, l’exécution locale des modèles de langage (LLM) passe d’une option expérimentale à une solution robuste et performante. Avec la version 0.3.15, LM Studio s’affirme comme […]

Le gaspillage de GPUs pèse sur le retour sur investissement dans les projets d’IA

La demande croissante en unités de traitement graphique (GPU) stimulée par les applications d’intelligence artificielle générative (GenAI) révèle d’importants défis opérationnels. Des entreprises du monde entier investissent dans les GPUs pour alimenter leurs stratégies d’IA, mais le manque d’optimisation de leur utilisation limite considérablement le retour sur investissement (ROI). Inefficacités dans la gestion des GPUs […]

HPE, Dell, Lenovo et Supermicro lancent de nouveaux serveurs avec GPUs MI325X et processeurs Epyc d’AMD

AMD offre des performances supérieures en IA avec les accélérateurs AMD Instinct MI325X.

HPE, Dell, Lenovo et Supermicro ont présenté de nouveaux serveurs conçus pour des charges de travail intensives en Intelligence Artificielle (IA), intégrant les dernières GPUs MI325X et les processeurs Epyc de 5ème génération d’AMD, anciennement connus sous le nom de Turin. Les annonces ont été faites suite à la présentation de ces puces par la […]