la course pour déployer des agents d’intelligence artificielle à l’échelle industrielle ouvre un nouveau front : Fujitsu et NVIDIA intensifient leur collaboration stratégique afin de co-créer une infrastructure IA de bout en bout. Cette alliance combine les CPUs Monaka de Fujitsu avec les GPUs du leader en accélération, reliées via NVLink Fusion. L’objectif est de concevoir des systèmes semi-personnalisés pour des secteurs comme la santé, la fabrication et la robotique, avec un premier déploiement ciblant le Japon et une expansion globale envisagée dans une seconde phase.
Ce projet s’articule autour de deux axes : un hardware co-conçu à l’échelle de racks et une plateforme d’agents IA basée sur Kozuchi, l’environnement cloud de Fujitsu lancé en octobre 2024. L’accord inclut également l’intégration du gestionnaire de charge IA de Fujitsu avec NVIDIA Dynamo, un cadre modulaire d’inférence, afin de faciliter l’adoption, optimiser les latences et maîtriser les coûts dans des environnements d’entreprise.
« La révolution industrielle de l’IA a commencé, et il devient essentiel de bâtir l’infrastructure qui la soutiendra — au Japon comme dans le reste du monde. Fujitsu est un pionnier et un leader de confiance dans le pays en supercalcul, recherche quantique et systèmes d’entreprise », a déclaré Jensen Huang, fondateur et PDG de NVIDIA, précisant que les deux fabricants “connectent et étendent” leurs écosystèmes pour l’ère de l’IA.
« Notre collaboration stratégique avec NVIDIA accélérera la transformation impulsée par l’IA dans les entreprises et les administrations », a ajouté Takahito Tokita, CEO de Fujitsu. Il a souligné que le premier secteur ciblé sera la fabrication, “où le Japon domine à l’échelle mondiale”, avec des plans d’expansion vers le HPC et la calcul quantique.
Quelles nouveautés ? NVLink Fusion ouvre la voie à une architecture “semi-custom”
Depuis des années, la pile NVIDIA est perçue comme fermée; l’introduction de NVLink Fusion brise partiellement cette inertie, en permettant que des accélérateurs non NVIDIA, comme les CPUs Monaka de Fujitsu, soient intégrés en usine avec des GPUs de la même marque dans des solutions à l’échelle de racks. Le buss NVLink constitue l’épine dorsale avec une large bande passante qui réduit les goulets d’étranglement entre les composants — une nécessité pour des agents IA raisonnés, planifiés, et agissant en quasi-temps réel.
Concrètement, le message adressé aux clients ayant des charges mixtes (calcul intensif, mémoire partagée, E/S exigeante) est clair : moins de bricolage, plus de performance soutenue et latences prévisibles. En définitive, cela signifie aussi plus de liberté pour orchestrer des configurations CPU+GPU aux profils variés selon le secteur et l’application.
Kozuchi : la “couche supérieure” prête à l’emploi
Fujitsu n’aborde pas la question du logiciel à l’état zéro. Kozuchi, sa plateforme IA cloud, rassemble services IA et un agent qui combine plusieurs modèles pour extraire des connaissances à partir de données métiers. Créé initialement pour des cas de négociation et rentabilité, il s’est progressivement étendu à la gestion de la production, aux questions juridiques et autres tâches transversales à l’entreprise.
Grâce à l’alliance, Kozuchi devient le point d’entrée d’une infrastructure combinant Monaka + GPU en sous-main, NVIDIA Dynamo (inferérences modulaires) pour l’exécution, et le gestionnaire de charge de Fujitsu pour assigner les tâches à la CPU ou à la GPU selon la coût, performance, protection des données. Pour les clients, cela se traduit par un unique “contrôle central”, masquant la complexité tout en exposant des APIs et des templates centrés sur les processus.
Pourquoi “agents” et pas simplement “modèles” ? Trois raisons stratégiques
- Autonomie supervisée. Un agent ne se contente pas de >répondre, il peut décider ses étapes,nappeler des outils, lire des systèmes (ERP, MES, CRM), rédiger et exécuter des actions avec contrôles et règles. Par exemple, en fabrication, un agent peut équilibrer la production, reprogrammer des commandes et notifier les fournisseurs, sans surcharge pour l’équipe humaine.
- Composition flexible. Les agents permettent d’enchaîner plusieurs modèles (vision, langage, séries temporelles) avec un coût global optimisé : réserver les GPUs pour ce qui doit impérativement s’exécuter en GPU, et faire réaliser la logique et le pré/post-traitement par la CPU lorsque cela suffit.
- Contexte et conformité. Avec une couche d’orchestration, on peut limiter l’accès à certaines données par les agents, journaliser leurs décisions et auditer leurs résultats, ce qui est primordial en santé, finance ou administration.
Le Japon comme terrain de lancement : un contexte idéal
Le premier déploiement sera effectué au Japon, un marché riche en supercalcul, en dynamisme industriel et où le pays mise sur une IA responsable. Là-bas, Fujitsu est un acteur historique du HPC et un partenaire de longue date des centres de recherche, ce qui facilite la mise en œuvre de pilotes nécessitant des données sensibles et de longs cycles de validation. Forts de ces références, le plan consiste à étendre à l’échelle internationale : les cas d’usage (lignes de montage, maintenance prédictive, copilotes en usine, triage médical, robots de stockage) étant facilement adaptables aux marchés locaux.
Les apports de chaque acteur
- Fujitsu : CPU Monaka, Kozuchi (plateforme et agent IA), gestion de charge, implantations sectorielles (fabrication, santé, robotique), relations avec l’écosystème japonais et une longue expérience en HPC et en informatique quantique.
- NVIDIA : GPUs, NVLink Fusion (interconnexion de haute capacité pour des architectures semi-personnalisées), Dynamo (inferérences modulaires), ainsi que tout un écosystème de bibliothèques et frameworks qui domine déjà l’industrie.
Le résultat : une pile “full-stack” où le client dispose d’agents prêts à s’intégrer avec du SaaS et des données sur site, soutenue par une architecture de référence validée conjointement par les deux partenaires.
En quoi cela diffère-t-il d’acheter simplement des GPUs ?
Les équipes ayant expérimenté le passage d’un PoC à la production savent que 80 % du travail se réalise après la démonstration : latences introuvables, coûts par token qui explosent, files d’attente saturées, données qui ne circulent pas assez vite, enjeux de conformité et d’audit qui complexifient la mise en œuvre. La solution Fujitsu-NVIDIA s’attaque précisément à ces problématiques :
- Intégration CPU+GPU à niveau de rack avec NVLink Fusion → moins de sauts, plus de débit.
- Gestion d’orchestration qui sélectionne la trajectoire (CPU vs GPU) en fonction de latence et coût → solutions prévisibles et ajustables.
- Dynamo pour diviser et recombiner sans repasser toute la pile d’inférence.
- Kozuchi comme couche d’agent intégrant connectivité d’entreprise et modèles sectoriels.
Ce qui est promis : un temps de mise en valeur plus court et un coût total de possession (TCO) plus maîtrisé, évitant un bricolage de composants séparés.
De l’usine à l’hôpital : verticales à traction immédiate
- Fabrication : agents qui planifient la production en réaction à l’évolution de la demande, recalculent les lignes de production, et enrichissent les données via vision pour détecter les défauts. Le Japon est un terreau fertile grâce à son dynamisme industriel et sa culture d’amélioration continue.
- Santé : assistants qui résument les dossiers, proposent des trajectoires cliniques, et gèrent les rendez-vous et orientations tout en respectant la vie privée et la norme.
- Robotique : copilotes intégrant sensori di, navigation et raisonnement pour des tâches en entrepôts, usines ou hôpitaux.
Le défi ne se limite pas au plan technique : il requiert également une gouvernance de l’IA, des métriques de sécurité (aléas, drift), des cycles de ré-entraînement et une formation continue des équipes.
Ce que cela représentera pour le marché
- NVIDIA ouvre une voie “semi-personnalisée”. NVLink Fusion permet à des partenaires comme Fujitsu de faire converger leur CPU vers le même niveau que la GPU, réduisant ainsi la sensation de “taille unique”, tout en offrant aux intégrateurs plus de contrôle.
- Fujitsu propose une véritable “agence IA” avec du matériel co-conçu. Sa démarche ne se limite plus à des services : elle inclut une architecture optimisée avec une des pièces maîtresses du marché.
- Les clients bénéficient d’une voie plus facile vers la production. Moins de pièces détachées, des SLA plus clairs, et le soutien d’acteurs expérimentés aux orientations métier critique.
Questions en suspens
- Coût : comment le TCO d’une pile Monaka + GPU + NVLink Fusion se compare-t-il à une alternative CPU x86 + GPU ou GPU-only ?
- Portabilité : dans quelle mesure Dynamo + Kozuchi permettrait-ils de migrer entre nouvelles cloud et on-premise sans tout reconstruire ?
- Souveraineté des données : quels modes de déploiement seront proposés pour les secteurs soumis à de fortes contraintes réglementaires ?
- Écosystème : quels ISV et partenaires certifiés accompagneront les premiers pilotes ?
Indications stratégiques : HPC et quantique en vue
Les deux entreprises anticipent que leur collaboration s’étendra vers le calcul haute performance et le calcul quantique, domaines où Fujitsu possède une longue expérience, et où NVIDIA construit déjà des ponts avec ses logiciels pour la simulation et l’accélération quantique. La logique est cohérente : des agents IA de plus en plus sophistiqués auront besoin de backends physiques, optimisés et simulés, dépassant la simple compréhension linguistique.
En résumé
- Ce que l’on fait : Fujitsu et NVIDIA co-développeront une infrastructure IA complète pour agents, combinant CPUs Monaka et GPUs avec NVLink Fusion, en intégrant également Kozuchi et Dynamo en logiciel.
- Objectif : dans les secteurs santé, fabrication, robotique et autres où les agents peuvent planifier et exécuter des tâches sous supervision.
- Localisation : en premier lieu au Japon, puis une expansion mondiale.
- Enjeux : offrir une solution industrielle permettant de faire passer une POC à la production avec un performance» prévisible et une gouvernance IA» intégrée.
Ce partenariat illustre une tendance importante : les agents IA ne seront plus de simples éléments expérimentaux de laboratoire, mais deviendront des opérateurs numériques enracinés dans des processus concrets. Pour y parvenir, la recette repose moins sur “magie” et davantage sur une ingénierie systémique, précisément la promesse de cette collaboration.
Questions fréquentes
Qu’est-ce que NVLink Fusion et en quoi est-ce crucial pour les agents d’IA ?
C’est l’extension de l’écosystème NVLink permettant de construire des solutions semi-personnalisées à l’échelle de rack, en connectant des accélérateurs non NVIDIA comme le Monaka avec des GPU, offrant ainsi un plus grand débit, moins de latence et un pipeline plus fluide.
Quel rôle joue Kozuchi dans la démarche Fujitsu-NVIDIA ?
Kozuchi est la plateforme IA de Fujitsu : elle propose des services d’agents, gère des données et connecte avec les systèmes d’entreprise. Dans cette alliance, elle orchestre, avec Dynamo et le gestionnaire de charge de Fujitsu, la sélection de l’exécution sur CPU ou GPU en fonction du coût et de la latence.
Quels secteurs seront les premiers à adopter ces agents en production ?
L’expansion initiale concerne la fabrication au Japon, suivie par la santé et la robotique, où ces agents pourraient automatiser la prise de décision (replanification, triage, maintenance) tout en conservant des contrôles et une auditabilité.
Comment faciliter l’adoption pour une entreprise en début de projet ?
Grâce à des modèles d’agents et des architectures de référence déjà validés par les deux partenaires, à Dynamo pour la modularité de l’inférence, et au gestionnaire de charge de Fujitsu pour le déploiement cloud ou on-premise avec des métriques Claires de SLA et de coût.
Source : sdxcentral