Huawei Cloud a dévoilé à Shanghai une nouvelle génération de produits dédiés à l’intelligence artificielle agentique, portés par une vision claire : les entreprises ont besoin non seulement de modèles plus puissants, mais aussi d’une infrastructure capable d’exécuter des agents de manière sécurisée, continue et efficace. L’annonce a été faite lors de Huawei Cloud INSPIRE 2026, organisé au West Bund International Convention & Exhibition Center, où la société a introduit le concept d’Agentic Infra ainsi qu’une série de services pour l’entraînement, l’inférence, la mémoire, la sécurité, la gouvernance et le déploiement industriel d’agents.
Cette démarche intervient à un moment où le marché dépasse la phase de tests isolés avec des modèles génératifs. La prochaine étape est la production : des agents capables de raisonner, consulter des données, exécuter des tâches, maintenir un contexte sur de plus longues périodes et opérer dans des secteurs tels que la santé, la fabrication, l’énergie, la robotique, la recherche scientifique ou l’administration. Pour Huawei Cloud, cette avancée requiert une architecture différente de celle du cloud traditionnel, avec une coordination renforcée entre matériel, logiciel, stockage, réseaux, sécurité et plateformes de développement.
Agentic Infra : une usine de tokens pour les charges générales et l’IA
Au cœur de l’annonce se trouve Agentic Infra, une nouvelle infrastructure unifiée pour charges générales et charges IA. Huawei Cloud la définit selon quatre principes : une « usine de tokens » efficace, un apprentissage continu, une planification unifiée pour le calcul général et l’IA, ainsi qu’une autonomie sécurisée. Bien que cette expression puisse paraître ambitieuse, elle répond à une problématique concrète : faire tourner des agents à grande échelle ne se limite pas à disposer de GPU ou NPUs, mais nécessite une coordination étroite entre calcul, mémoire, réseau, inférence et isolation avec une faible latence.
L’un des principaux produits est le service AI Cluster, AICS, construit sur le réseau UnifiedBus. Selon Huawei Cloud, ce service supporte des clusters de plus de 100 000 cartes, avec une capacité totale pouvant atteindre 200 EFLOPS. La société indique également avoir réduit la latence de génération de tokens à moins de 10 millisecondes, avec une performance pouvant atteindre 5 millions de tokens par seconde sur 1 000 cartes, tout en assurant une disponibilité en ligne de 99,95 %.
AICS apparaît ainsi comme une pièce maîtresse pour faire fonctionner de grandes charges d’inférence et d’entraînement, notamment dans des scénarios où le volume de requêtes et la latence sont cruciaux. En pratique, Huawei ambitionne de positionner cette infrastructure comme une alternative pour les entreprises et industries qui souhaitent déployer de l’IA à grande échelle sans dépendre d’un ensemble fragmenté de services.
| Produit ou service | Fonction principale | Faits saillants annoncés |
|---|---|---|
| AI Cluster Service (AICS) | Clusters d’IA pour entraînement et inférence | Plus de 100 000 cartes, jusqu’à 200 EFLOPS |
| Agentic Memory Storage (AMS) | Mémoire persistante et évolutive pour agents | Stockage PB-scale, pooling KV-cache par niveaux |
| CCE VolcanoNext | Planification unifiée pour charges générales et IA | Amélioration de plus de 30 % de l’utilisation des ressources |
| AgentSphere | Exécution sécurisée et flexible d’agents | Démarrage en moins de 100 ms |
| ModelArtsNext | Plateforme d’entraînement et d’inférence | Routage de modèles, RLaaS pour entreprises |
| AgentArts | Plateforme d’entreprise pour agents | Tâches longues, sécurité, savoir-faire sectoriel, observabilité |
| openJiuwen | Version open source d’AgentArts | Partage plus de 90 % du noyau avec AgentArts Enterprise |
| CloudRobo | Plateforme cloud pour robots | Migrer en heures, déployer en minutes |
Un autre élément clé est Agentic Memory Storage, AMS, conçu pour dépasser le goulet d’étranglement mémoire des agents. Huawei Cloud explique qu’il combine NPU passthrough avec le stockage de mémoire contextuelle pour créer un espace mémoire atteignant l’échelle du pétaoctet. Il supporte également le pooling KV-cache par niveaux, une technique essentielle pour réduire les coûts d’inférence et gérer des tâches prolongées.
Cette capacité est fondamentale car les agents ne se limitent pas à la simple consommation de calcul : ils doivent maintenir un contexte, récupérer de la mémoire, fonctionner sur de longues périodes et gérer des états intermédiaires. Sans une couche mémoire efficace, les coûts et la complexité des agents augmentent considérablement.
De son côté, CCE VolcanoNext agit comme moteur de planification unifiée pour charges générales et IA. Huawei Cloud affirme qu’en consolidant le partage de ressources entre entraînement et inférence tout en réduisant la fragmentation, il est possible d’améliorer l’efficacité de plus de 30 %. Dans un contexte d’entreprise, cela peut faire une différence économique notable, car beaucoup de projets IA échouent non par manque de modèles, mais à cause de coûts d’infrastructure difficiles à maintenir (voir article).
ModelArtsNext et AgentArts : du modèle à l’agent d’entreprise
Huawei Cloud a également dévoilé ModelArtsNext, une nouvelle plateforme pour l’entraînement et l’inférence de modèles. Ses quatre principales capacités sont le Reinforcement Learning as a Service, inférence confidentielle, routage de modèles et gestion de matrice de modèles. Le routage MaaS permet d’appliquer trois stratégies : priorité à l’expérience, priorité à l’efficacité ou mode équilibré. La plateforme choisit dynamiquement le modèle adapté à chaque requête en fonction de ses caractéristiques.
Selon Huawei Cloud, plus de 15 services de modèles de dernière génération sont déjà disponibles, avec un taux précis d’ordonnancement supérieur à 95 % et une réduction en moyenne de 20 % des coûts d’appel. Cette approche répond à une tendance claire : les entreprises ne veulent plus dépendre d’un seul modèle pour tout, mais router chaque tâche vers le modèle le plus approprié en termes de coût, performance, précision, latence ou conformité.
Le RLaaS d’entreprise constitue une autre étape stratégique. Huawei Cloud souhaite rendre l’apprentissage par renforcement accessible aux organisations désireuses d’ajuster leurs modèles à des processus spécifiques. La société indique que les utilisateurs pourront créer des tâches en un minute, bénéficier d’une visualisation de bout en bout et garantir la cohérence entre entraînement et inférence.
AgentArts complète cette couche plateforme. Ce module destiné aux entreprises permet de créer et déployer des agents IA disposant de quatre capacités principales : gestion des tâches longues en production, sécurité renforcée, connaissance sectorielle approfondie et observabilité complète. Huawei évoque une « ingénierie harness », visant à organiser et contrôler l’utilisation qu’ont les agents de leurs outils, données, mémoire, modèles et processus.
La société a aussi lancé openJiuwen, une version open source d’AgentArts partageant plus de 90 % de son noyau avec la version d’entreprise. Ce mouvement peut attirer développeurs et partenaires, tout en conservant la valeur ajoutée dans l’intégration à l’infrastructure, le support, la gouvernance et les services cloud de Huawei.
Autre innovation, AgentArts Orchard agit comme un portail central regroupant services cloud agentiques, agents, modèles et applications. Son but : automatiser tout le processus, depuis la compréhension de l’intention et le développement de fonctionnalités, jusqu’au provisionnement et au déploiement d’applications. Huawei souhaite ainsi faire participer activement les agents à la création et à l’exploitation de nouveaux services.
Sécurité, cloud hybride et industrie comme axes principaux
La sécurité a occupé une place centrale dans cette annonce. Huawei Cloud a présenté une solution couvrant l’ensemble du cycle de vie de l’IA, assurant la protection des agents, des modèles et de l’infrastructure agentique. Parmi les innovations, on trouve une zone de sécurité des données avec chiffrement matériel dédié, la technologie Hold Your Own Key, des capsules de données, ainsi qu’un isolement multidimensionnel pour l’infrastructure agentique. Le message est clair : répondre aux enjeux de souveraineté, de confidentialité et de contrôle des données dans des secteurs réglementés.
Huawei a aussi annoncé une solution de calcul confidentiel pour l’IA, comprenant des machines virtuelles sécurisées, une attestation distante dans le cloud, la gestion de clés, une passerelle d’inférence confidentielle, ainsi que le passthrough NPU basé sur PCIPC. Elle cible principalement l’inférence confidentielle, le pré-entraînement confidentiel et l’apprentissage fédéré confidentiel, trois scénarios où la protection des données ou des modèles est critique.
De plus, Huawei Cloud a publié un livre blanc intitulé Building Agent-Oriented Hybrid Cloud for Enterprises, qui explore l’évolution du cloud hybride dans l’ère des agents. La société met en avant que plus de 5 500 clients dans le monde utilisent déjà sa solution de cloud hybride et qu’elle occupe une position privilégiée dans les secteurs financier et des clouds dédiés. Le document aborde la construction de lacs de données IA, la coordination entre modèles en ligne stables et itérations offline plus agiles, ainsi que la création d’environnements sécurisés pour le développement et l’exécution d’agents.
Sur le plan sectoriel, Huawei Cloud a lancé quatre zones dans son Industry AI Foundry : Zone Santé Intelligente, Zone IA incarnée, Zone Manufacturing Intelligente, et Zone Calcul Scientifique. La première est renforcée par une plateforme IA pour la santé, en bêta ouverte dès le 30 juin, avec une solution de pathologie intelligente déjà déployée dans plusieurs hôpitaux en Chine. Plus de 20 établissements y participent, selon la société.
La Zone IA incarnée est orientée vers l’IA physique et la robotique. Huawei Cloud a présenté CloudRobo, une plateforme de développement intelligent pour robots combinant données pétaoctet, pipelines de développement, moteur cloud-native de production robotique, et un système Real-Sim pour la génération de données et l’évaluation. La société indique que cette plateforme permet de migrer les robots vers le cloud en quelques heures et de déployer des modèles en quelques minutes, avec une bêta prévue pour le 30 juin.
La Zone Manufacturing Intelligente vise à faciliter les agents industriels, tandis que la Zone de calcul scientifique cible les clients de l’IA pour la science, avec des modèles et agents accélérant la recherche.
Huawei Cloud a aussi annoncé un programme partenariat pour les modèles IA, en collaboration avec plus de 20 fournisseurs, parmi lesquels Zhipu AI, DeepSeek, MiniMax, Kimi, StepFun, Baidu, iFLYTEK Spark, Meituan, AIsphere et Shengshu Technology. L’objectif est de construire un écosystème de modèles variés et connecté à ses services cloud.
L’annonce de Huawei Cloud traduit une stratégie ambitieuse : ne pas se limiter à vendre des modèles ou de l’infrastructure, mais à proposer une véritable pile technologique pour l’ère agentique. Clusters, mémoire, routage, runtime sécurisé, plateformes d’agents, cloud hybride, sécurité, secteur industriel et écosystème de modèles s’inscrivent dans une vision cohérente. Reste à prouver que cette intégration pourra concurrencer hors de Chine dans un marché de plus en plus marqué par la réglementation, la souveraineté numérique, les sanctions, la compatibilité et la confiance.
Questions fréquentes
Qu’est-ce que Agentic Infra de Huawei Cloud ?
Agentic Infra est la nouvelle proposition d’infrastructure de Huawei Cloud pour exécuter des charges générales et de l’IA agentique. Elle intègre calcul, mémoire, planification, sécurité et runtime pour les agents d’entreprise.
Que apporte Agentic Memory Storage ?
Agentic Memory Storage, AMS, crée un espace mémoire capable d’atteindre l’échelle du pétaoctet. Il supporte le pooling KV-cache hiérarchisé, permettant de réduire les coûts d’inférence et de supporter des tâches prolongées d’agents.
Qu’est-ce qu’AgentArts ?
AgentArts est la plateforme d’entreprise de Huawei Cloud pour créer, déployer et exploiter des agents IA en production, avec des capacités pour les tâches longues, la sécurité, la connaissance sectorielle et l’observabilité.
Quels secteurs Huawei Cloud privilégie-t-il ?
Huawei Cloud a lancé des zones spécifiques pour la santé intelligente, l’IA physique et la robotique, la fabrication intelligente, ainsi qu’un programme avec des fournisseurs de modèles tels que DeepSeek, MiniMax, Kimi ou Zhipu AI.
Source : Huawei