Lenovo s’associe à NVIDIA pour déployer l’IA hybride en production réelle

Info Cloud

X (Twitter) Facebook Pinterest LinkedIn Email

Lenovo a profité de NVIDIA GTC 2026 pour renforcer son offensive dans l’intelligence artificielle d’entreprise avec l’expansion de Lenovo Hybrid AI Advantage avec NVIDIA, une offre qui couvre tout, des stations de travail et de l’edge computing aux centres de données, en passant par les déploiements à grande échelle pour le cloud IA. La société présente cette initiative comme une étape cruciale pour accélérer l’adoption de l’IA, réduire le time-to-first-token (TTFT) et faire progresser les projets du pilote à la production avec des résultats plus mesurables.

Ce lancement intervient à un moment où la discussion autour de l’IA ne se limite plus à l’entraînement des modèles, mais se concentre surtout sur l’inférence, le coût par token et la capacité à gérer des charges en temps réel dans des environnements hybrides. Lenovo appuie cette approche dans son CIO Playbook 2026, une étude réalisée par IDC pour la société, selon laquelle 84 % des organisations envisagent d’exécuter des charges IA en local ou à la périphérie, en complément du cloud. Étant une étude commanditée par Lenovo, il faut la lire comme un indicateur de marché plutôt que comme une validation indépendante du secteur.

Des stations de travail au centre de données

Parmi les nouveautés présentées, Lenovo a mis en avant de nouvelles stations de travail mobiles et de bureau, équipées de la technologie NVIDIA RTX Pro Blackwell. Cela inclut de nouvelles gammes ThinkPad P et ThinkStation, ainsi qu’un AI Developer Device basé sur ThinkStation PGX, capable, selon la société, de traiter des modèles comptant jusqu’à 200 milliards de paramètres et d’atteindre 1 petaflop de puissance de calcul IA pour le développement et l’inférence en environnements privés ou locaux. La société a également lancé un nouveau pack d’outils pour développeurs et des services de préparation des dispositifs afin de simplifier leur déploiement.

Côté infrastructure, Lenovo a présenté de nouvelles plateformes d’inférence basées sur ThinkSystem et ThinkEdge, ainsi que des configurations hybrides intégrant des GPU NVIDIA RTX PRO 6000 Blackwell Server Edition, RTX PRO 4500 Blackwell Server Edition, et une gamme supportée par NVIDIA Blackwell Ultra pour l’entraînement, le tuning fin et l’inférence à grande échelle. La société a ajouté des intégrations avec Nutanix Enterprise AI, Cloudian et Veeam Kasten, et a annoncé un partenariat renforcé avec IBM Technology Lifecycle Services pour accélérer les déploiements hybrides de l’IA. Tout cela s’inscrit dans une stratégie de plateforme globale, plutôt que dans une approche orientée produit isolé.

Vers des “AI factories” avec Vera Rubin

La partie la plus ambitieuse de cette annonce concerne le cloud IA et ce que Lenovo nomme des déploiements à l’échelle gigawatt. La société s’est positionnée comme partenaire de lancement de NVIDIA Vera Rubin NVL72, la nouvelle plateforme rack-scale présentée par NVIDIA lors du GTC. NVIDIA décrit Vera Rubin NVL72 comme un système intégrant 72 GPU Rubin et 36 CPU Vera, promettant jusqu’à 10 fois plus de performance d’inférence par watt et un coût par token divisé par dix par rapport aux générations précédentes dans certains scénarios. Ces chiffres proviennent du fabricant, et, comme toujours dans ce type d’annonces, leur impact dépendra fortement du type de modèles et de charges testés.

Lenovo envisage d’utiliser cette architecture pour bâtir ce qu’elle appelle Lenovo AI Cloud gigafactory, ainsi que les systèmes HGX Rubin NVL8 et des collaborations avec des acteurs comme Nscale pour des déploiements hyper-échelle. La logique commerciale est claire : si l’intelligence artificielle agentique multiplie l’inférence, alors il ne suffira plus seulement d’avoir des GPU, mais de réduire le délai de déploiement, d’améliorer l’économie par token, et d’opérer des racks entiers avec refroidissement liquide et services associés.

Au-delà de l’approche promotionnelle, cette stratégie traduit une tendance importante sur le marché : Lenovo ne souhaite pas simplement vendre du matériel, mais se positionner comme un fournisseur d’une chaîne complète pour l’IA hybride, du poste de travail à l’infrastructure d’inférence, en passant par les grands déploiements cloud. Dans un secteur où Dell, HPE, Supermicro et les hyperscalaires investissent aussi fortement, ce repositionnement revêt une importance stratégique. Et il confirme une autre tendance : d’ici 2026, la compétition ne portera plus uniquement sur l’entraînement de modèles, mais aussi sur la mise en production rapide, maîtrisée et rentable de l’inférence.

Questions fréquentes

Qu’est-ce que Lenovo Hybrid AI Advantage avec NVIDIA ?
C’est l’offre de Lenovo pour déployer une IA hybride intégrant les technologies NVIDIA, à travers des dispositifs, de l’edge, des centres de données ou du cloud, combinant matériel, logiciel et services pour passer du pilote à la production.

Que signifie TTFT dans ce contexte ?
TTFT désigne le time-to-first-token, une métrique utilisée en inférence pour mesurer le temps écoulé entre la début de la requête et la génération du premier token de réponse. Lenovo la considère comme un indicateur clé à optimiser.

Quel rôle joue NVIDIA Vera Rubin NVL72 ?
C’est la nouvelle plateforme rack-scale dévoilée lors du GTC 2026. Lenovo prévoit de s’en servir comme socle pour ses futurs infrastructures cloud IA et déploiements d’inférence à grande échelle.

Ce chiffre de 84 % d’organisations utilisant l’IA hybride est-il fiable ?
Il provient du IDC CIO Playbook 2026, commandé par Lenovo. Ce chiffre est utile pour comprendre la dynamique du marché, mais ne doit pas être considéré comme une validation neutre du portefeuille Lenovo proprement dit.

Source : news.lenovo