Google alerte : la mémoire freine les grands modèles d’IA

Google alerte : la mémoire, pas le calcul, est le vrai goulot d’étranglement des grands modèles d’IA. La bande passante mémoire est souvent le facteur limitant pour l’inférence, pas la puissance GPU. Solutions : architectures HBM plus rapides, quantification, caches KV optimisés. Cela explique pourquoi SK hynix mise sur la HBM5 hybride et pourquoi la […]
Gartner avertit : l’IA explicable stimulera la surveillance des LLM

La course pour déployer une intelligence artificielle générative dans les environnements professionnels entre dans une nouvelle phase. Il ne suffit plus de lancer des copilotes, des assistants ou des flux automatisés : il est désormais essentiel de prouver la fiabilité de ces systèmes, leur conformité aux attentes et la possibilité d’auditer leurs réponses. Dans ce […]
UC San Diego renforce sa recherche en inférence de LLM avec un système NVIDIA DGX B200

La course à la mise en service de modèles de langage à faible latence ne se résume plus seulement à des articles et des benchmarks : de plus en plus, la victoire se joue dans le laboratoire de systèmes, où le goulet d’étranglement réside souvent dans la façon dont le modèle est « servi » […]
Intel renforce le Project Battlematrix avec LLM Scaler v1.0 : jusqu’à 80 % de performance supplémentaire sur les GPU Arc Pro et prise en charge avancée de l’IA multimodale

Intel ha realizado un avance estratégico en su apuesta por el mercado de inteligencia artificial empresarial con la introducción de la versión 1.0 de LLM Scaler, la primera gran actualización del software para su proyecto Project Battlematrix. Esta nueva versión promete un incremento de hasta el 80 % en rendimiento, con optimizaciones específicas para modelos […]
L’essor des LLM open source : vers une intelligence artificielle plus démocratique et durable

L’essor des modèles de langage open source : une révolution en route La révolution de l’intelligence artificielle générative ne montre aucun signe de ralentissement. Alors que les entreprises, les gouvernements et les citoyens découvrent son potentiel transformateur, le débat grandit sur la manière de construire une IA plus accessible, sûre et durable. C’est à ce […]
Jusqu’où se souviennent les modèles de langage ? Une analyse révèle la véritable capacité de contexte des LLM.

Concurrence pour étendre la fenêtre contextuelle des modèles de langage : une nouvelle étude remet en question les claims de performance Dans la bataille technique pour élargir la fenêtre contextuelle des modèles de langage, des entreprises éclairées telles qu’OpenAI, Google, Anthropic et Meta s’affrontent pour proposer des modèles capables de traiter une quantité croissante de […]
GAIA : Exécute des agents LLM sur des PC Ryzen AI en quelques minutes

La plateforme GAIA d’AMD : Une révolution dans l’exécution de l’intelligence artificielle générative sur PC local La technologie de l’intelligence artificielle générative évolue rapidement, transformant le paysage technologique et permettant la création de textes et des prises de décisions autonomes. Pour exécuter ces applications puissantes directement sur votre PC local, GAIA d’AMD se présente comme […]
UGREEN dévoile le stockage avec le premier NAS AI avec LLM intégré présenté au CES 2025

Le CES 2025 est devenu la scène où UGREEN, leader dans la technologie grand public, a révélé son innovant AI NAS avec un modèle de langage de grande taille (LLM) intégré. Sous la devise « Activez la possibilité de l’AI NAS », UGREEN a présenté le révolutionnaire NASync iDX6011, qui promet de transformer le stockage en réseau […]