Huawei a présenté à Paris une nouvelle solution d’infrastructure de données pour les centres de données dédiés à l’intelligence artificielle, une proposition par laquelle la société chinoise souhaite renforcer son rôle dans l’une des couches les moins visibles mais cruciales de l’adoption de l’IA en entreprise : la façon dont sont stockés, préparés, récupérés, protégés et réutilisés les données qui alimentent modèles et agents.

L’annonce a été faite lors du Huawei Innovative Data Infrastructure Forum 2026, qui s’est tenu le 21 mai. Yuan Yuan, vice-président de Huawei et président de la division des produits de stockage de données, a souligné que la prochaine étape de l’IA en entreprise sera essentiellement guidée par les données. Son message est clair : si les entreprises veulent déployer des agents, des modèles et des systèmes d’inférence à grande échelle, il ne suffit pas d’acheter plus de GPU ou d’accélérateurs. Elles ont aussi besoin d’une architecture de gestion des données pensée dès le départ pour les charges d’IA.

La proposition de Huawei combine plusieurs éléments : data lake, plateforme de données pour l’IA, gestion de mémoire contextuelle, ingénierie de modèles, orchestration des ressources, création d’agents et résilience des données. Il s’agit d’une approche complète en pile (full stack), visant à couvrir l’ensemble depuis le stockage physique jusqu’à l’exploitation en production d’agents d’entreprise.

Les données comme le principal goulot d’étranglement de l’IA en entreprise

Au cours des deux dernières années, une grande partie des discussions autour de l’intelligence artificielle s’est concentrée sur les modèles, les accélérateurs et les centres de données. Mais la véritable adoption en entreprise se heurte souvent à un problème plus fondamental : les données ne sont pas toujours prêtes à alimenter des systèmes d’IA de manière sûre, rapide et fiable.

Une société peut disposer d’années d’informations dispersées entre sites, applications, bases documentaires, systèmes industriels, dépôts d’images, logs, vidéos, bases vectorielles et plateformes cloud. Transformer toutes ces sources en connaissances exploitables pour des agents et modèles requiert plus que du simple stockage brut. Il faut importer des données multimodales, les classer, les rendre visibles, contrôler leur qualité, les récupérer avec une faible latence, et les protéger contre la manipulation, les ransomwares ou un usage non autorisé.

Huawei tente de répondre à ce défi avec sa solution d’infrastructure de données pour centres IA. Selon la société, l’architecture doit s’appuyer sur plusieurs piliers : lacs de données, plateformes IA, puissance de calcul, modèles, cadres pour agents, et résilience. Cette lecture est importante car elle recentre l’attention sur la base opérationnelle permettant la mise en production des modèles, plutôt que uniquement sur les modèles eux-mêmes.

Dans le cadre du data lake, Huawei met en avant OceanStor Pacific Scale-Out Storage, avec une densité déclarée de 11 pétaoctets en 2U. Ce chiffre illustre un défi majeur de l’IA : stocker d’énormes volumes de données sans augmenter l’espace physique ni le coût total de possession. La solution inclut également DME Omni-Dataverse, un espace unifié pour importer des données multimodales en temps réel entre sites, tout en offrant une visibilité globale et une récupération efficace sur de grands volumes de vecteurs.

Mémoire contextuelle et cache KV : la bataille de l’inférence

L’un des éléments techniques clés du lancement est le Context Memory Storage (CMS), présenté par Huawei comme une solution pour des clusters d’inférence à grande échelle. Son objectif est de créer un immense pool de cache KV partagé, atteignant l’échelle du pétaoctet, et compatible avec une puissance de calcul hétérogène.

Le cache KV est un composant essentiel pour l’inférence de modèles linguistiques, permettant de conserver des informations intermédiaires générées pendant une conversation ou une tâche, afin d’éviter de recalculer tout à chaque étape. Dans des flux avec agents, documents longs ou sessions persistantes, cette mémoire devient critique pour réduire la latence et les coûts.

Huawei affirme que le CMS peut réduire jusqu’à 90 % le temps jusqu’au premier token (TTFT). Il faut considérer cette donnée comme une métrique déclarée par le constructeur, susceptible d’être validée selon la configuration et la charge réelle. Quoi qu’il en soit, cette orientation indique la tendance du marché : l’inférence ne dépend plus uniquement de l’accélérateur, mais aussi de la gestion de la mémoire, du contexte, du cache, du stockage et du réseau.

La société a également présenté une plateforme « 3+1 » pour l’inférence en contexte d’entreprise. Elle intègre l’accélération du cache KV, une base de connaissances avec plus de 95 % de précision dans la récupération, d’après Huawei, ainsi qu’un banc de mémoire en évolution. En outre, le Unified Cache Manager permettrait de coordonner cette mémoire pour améliorer la précision de l’inférence jusqu’à 30 %, selon les données de l’entreprise.

Capacités annoncées par Huawei Fonction principale Métrique communiquée
OceanStor Pacific Stockage scale-out pour data lake 11 PB en 2U
DME Omni-Dataverse Espace de données unifié et récupération vectorielle Recherche dans des centaines de milliards de vecteurs
Context Memory Storage Pool partagé de cache KV Faut jusqu’à 90 % moins de TTFT
Plateforme 3+1 Cache, connaissance et mémoire pour inférence Plus de 95 % de précision dans la récupération
Unified Cache Manager Gestion de cache et mémoire Faut jusqu’à 30 % plus de précision
ModelEngine Nexent Création d’agents par langage naturel Faut jusqu’à 80 % moins de temps de déploiement

Modèles et agents intégrés dans l’infrastructure

Huawei ne limite pas sa proposition au stockage. Elle inclut aussi ModelEngine, une couche conçue pour faciliter l’utilisation de modèles, leur déploiement en un clic et leur adaptation sans code à de nouveaux modèles. L’entreprise évoque aussi un partitionnement fin des ressources de calcul, avec un ratio pouvant aller jusqu’à 1:10 en partage de xPU, afin qu’une même ressource serve à plusieurs usages.

Ce volet est crucial, car de nombreuses entreprises ne déploieront pas un seul modèle ou une seule charge. Elles disposeront d’assistants internes, d’agents de support, de systèmes d’analyse documentaire, de modèles de vision, de moteurs de recherche sémantiques, de flux d’automatisation et d’applications métier, qui rivaliseront pour les ressources. Si cette demande n’est pas bien gérée, l’IA peut devenir une infrastructure coûteuse et difficile à gouverner.

Le second composant est ModelEngine Nexent, une plateforme pour générer des agents via une interaction en langage naturel. Huawei affirme qu’elle permet de réduire de 80 % le délai de déploiement, et que les agents s’améliorent grâce à une optimisation automatique des compétences, prompts et mémoire. Bien que ces chiffres proviennent du fabricant, ils traduisent une évolution profonde : les agents ne sont plus de simples expérimentations de laboratoire, mais deviennent des éléments opérationnels du monde professionnel.

Ce scénario s’inscrit dans une tendance plus large : celle où les agents sont perçus comme des « employés numériques » capables d’interroger des données, d’utiliser des outils, de lancer des processus et de maintenir leur contexte. Cependant, cela comporte aussi des risques. Si un agent a accès à des documents, à des systèmes critiques ou à des données sensibles, l’infrastructure doit enregistrer toutes ses actions, avec quels droits, sur quelles informations, et sous quel contrôle.

La résilience des données intégrée à l’architecture IA

Le dernier volet de l’annonce porte sur la résilience. Huawei met en garde contre des risques tels que l’utilisation abusive d’outils, la contamination de données, la manipulation et les ransomwares. Cette mention est importante car la sécurité de l’IA ne se limite pas à la protection des modèles. Elle doit également assurer la sécurité des données d’entraînement, des bases documentaires, des vecteurs, des mémoires d’agents, des flux de cache et des systèmes alimentant l’inférence.

Un agent manipulé avec des données corrompues peut prendre de mauvaises décisions. Une base de connaissances contaminée peut produire des réponses erronées. Un ransomware attaquant le dépôt documentaire peut paralyser des processus critiques. Une mémoire d’agent contenant des données sensibles mal sécurisées peut devenir une source de fuite. Il est donc crucial que l’infrastructure de gestion des données pour l’IA soit conçue dès le départ avec des mesures de protection intégrées, plutôt que comme une étape additionnelle.

L’annonce de Huawei présente aussi une lecture concurrentielle. La société ne cherche pas uniquement à vendre des unités de stockage, mais une architecture globale pour les centres IA en entreprise. Sur un marché dominé par NVIDIA dans la discussion autour de la puissance de calcul, et où les hyper-scalers proposent des plateformes IA intégrées, Huawei souhaite se positionner à partir de la couche de gestion des données, de la mémoire, du stockage, et des agents.

Cette démarche intervient dans un contexte géopolitique où la Chine cherche à réduire sa dépendance technologique et à développer ses propres plateformes IA. Avec son expertise dans les télécoms, le cloud, le stockage et les puces Ascend, Huawei tente de bâtir une alternative plus intégrée pour ses clients industriels, administratifs et grands comptes.

Le défi sera de prouver leur performance réelle, leur capacité d’interopérabilité, leur coût, et leur maturité en dehors d’environnements contrôlés. Les chiffres présentés sont ambitieux, mais les entreprises auront besoin de tests avec leurs propres données, leurs charges et leurs exigences réglementaires. En IA en entreprise, le simple marketing technique ne suffit pas : il faut des architectures stables, sécurisées et maintenables.

Ce qui reste essentiel, c’est le message fondamental : la prochaine étape de l’IA ne dépendra pas uniquement de modèles de plus en plus grands, mais aussi d’infrastructures capables d’alimenter ces modèles avec des données fiables, une mémoire efficace, une recherche rapide, des agents contrôlés, et une protection contre les défaillances ou les attaques. Huawei a placé la barre : le centre de données dédié à l’IA commence par le stockage des données.

Questions fréquentes

Que présente Huawei lors de l’IDI Forum 2026 ?
Huawei a dévoilé une solution d’infrastructure de données complète pour centres IA : stockage, data lake, mémoire contextuelle, gestion de modèles, agents et résilience.

Qu’est-ce que Context Memory Storage (CMS) ?
Une proposition de Huawei pour créer un pool partagé de cache KV à grande échelle dans les clusters d’inférence, afin de réduire la latence et optimiser l’utilisation mémoire lors de charges d’IA.

Pourquoi la cache KV est-elle importante dans l’IA générative ?
Elle permet de réutiliser l’information intermédiaire lors de la génération de texte ou l’exécution d’agents, diminuant les calculs redondants et améliorant la réactivité sur des sessions longues.

Quels risques de sécurité Huawei souhaite-t-elle couvrir ?
Les risques liés à une utilisation abusive des outils, à la poisoning des données, à la manipulation malveillante et aux ransomwares, essentiels lorsque agents et modèles s’appuient sur de grands dépôts de données.