Annoncée le 3 juin 2026 lors de Cisco Live! à Las Vegas, la nouvelle génération de solutions FlexPod marque un pivot clair pour NetApp et Cisco. Les deux fabricants ne vendent plus une architecture convergente générique : ils livrent des configurations validées pour des charges précises, RAG, recherche sémantique, inférence, edge computing, avec sécurité et gouvernance des données intégrées dès la conception. Selon NetApp, les déploiements FlexPod existants ont déjà permis à leurs clients de réduire jusqu’à 20 % le temps de gestion et de maintenance des infrastructures. L’enjeu est maintenant d’étendre ce gain aux projets d’IA qui passent du laboratoire à la production.
FlexPod face aux exigences de la production IA
Les entreprises ne testent plus des modèles dans des environnements isolés. Elles veulent déployer en production, relier des modèles à leurs référentiels internes, lancer des assistants, accélérer des inférences, et maintenir une performance prévisible avec une gouvernance des données qui résiste à l’audit. Ce saut du pilote vers la production n’est pas qu’un défi de modèle : c’est surtout un défi d’infrastructure.
NetApp positionne FlexPod comme une réponse à cette transition. L’architecture convergente historique, construite sur les technologies des deux fabricants depuis des années, s’adapte désormais aux scénarios IA les plus exigeants : RAG, recherche sémantique, inférence à grande échelle, déploiements haute performance. Et la sécurité n’est plus rajoutée en dernière étape, elle fait partie du design initial.
L’approche répond à un problème récurrent. Beaucoup d’organisations ont constitué leurs premiers environnements IA en assemblant des pièces disparates, une démarche qui sert à apprendre mais qui complique sérieusement la montée en charge, la sécurisation et le maintien en production. FlexPod mise sur l’intégration testée, les composants à vocation entreprise et les modèles de déploiement reproductibles pour éviter ce scénario.
| Domaine | Apports de la solution FlexPod IA | Impact concret |
|---|---|---|
| Stockage | NetApp AFX, approche découplée | Performance et capacité scalables indépendamment |
| Données | AI Data Engine intégré au design NVIDIA AI Data Platform | Découverte, préparation et gouvernance des données |
| Réseau | Cisco Nexus One, tissu haute performance | Optimisation des accélérateurs, latence réduite |
| Sécurité | Cisco Secure AI Factory avec NVIDIA, Zero Trust | Accès, conformité et exposition sous contrôle |
| Inférence et RAG | Solutions préintégrées pour équipes et départements | Barrière à l’entrée réduite |
| Edge computing | Cisco Unified Edge + stockage NetApp | IA distribuée avec gestion centralisée |
Données, réseau et sécurité : la couche invisible de l’IA
L’IA d’entreprise est souvent expliquée à partir des modèles ou des puces. Mais la couche de données conditionne une grande partie du résultat. Une organisation peut disposer de volumes importants d’informations sans pour autant les exploiter, si elle ne sait pas les localiser, les classifier, les préparer et les connecter aux bons modèles.
NetApp introduit dans cette proposition son AI Data Engine, dédié à la découverte, la préparation et la gouvernance des données au sein même de l’infrastructure. La technologie s’associe au design de référence NVIDIA AI Data Platform, pour que les données soient prêtes à alimenter les pipelines IA tout en conservant traçabilité et contrôle. L’idée est de ne pas laisser la valeur bloquée dans des référentiels que les modèles ne peuvent pas atteindre.
Cisco apporte la couche réseau et sécurité. Cisco Secure AI Factory avec NVIDIA incarne une approche où la sécurité s’intègre dès la conception du projet, pas en dernier recours. En IA, les risques vont bien au-delà de l’accès non autorisé : exposition de données sensibles, déficits de gouvernance, fuites via les requêtes, non-conformités réglementaires. Ces problèmes touchent aussi les équipes sécurité classiques, comme le montre la pression croissante sur le patching en production que subissent les DSI.
Le réseau joue également un rôle déterminant que les équipes IA sous-estiment souvent. Lors d’entraînements ou d’inférences intensives, disposer d’accélérateurs puissants ne sert pas à grand-chose si le réseau introduit de la latence ou des comportements imprévisibles. Cisco avance Nexus One comme composante d’une infrastructure réseau déterministe et haute performance, pour mieux exploiter les XPUs, réduire les délais de traitement et stabiliser les résultats.
Trois scénarios : entreprise, équipes et edge
NetApp et Cisco structurent les nouvelles solutions autour de trois cas d’usage distincts, chacun répondant à un niveau de maturité différent dans l’adoption de l’IA.
Le premier concerne l’IA à l’échelle de l’entreprise, pour les organisations qui veulent déployer une infrastructure haute performance dédiée au RAG et à la recherche sémantique. L’IA s’exécute au plus près des données internes, ce qui est essentiel pour les entreprises refusant de transférer de grandes quantités d’informations sensibles vers des environnements externes sans contrôle. L’Europe investit massivement dans ce type d’infrastructure souveraine, avec 20 milliards d’euros annoncés pour des gigafactories d’IA qui soulèvent pourtant des questions sur les bénéficiaires réels.
Le deuxième scénario vise l’inférence et les flux RAG pour des équipes ou des départements. Toutes les organisations n’ont pas besoin d’une usine d’IA complète dès le départ. Beaucoup veulent commencer par des assistants internes, des analyses documentaires, des outils de consultation de données en langage naturel ou de l’automatisation du support. Une solution préintégrée réduit le besoin de spécialistes pointus et accélère le passage au premier cas d’usage concret. C’est exactement dans cette logique que SAP intègre Claude d’Anthropic directement dans son ERP, pour des cas d’usage agentiques au cœur des processus métier.
Le troisième scénario concerne l’edge computing. L’IA en périphérie est pertinente quand les données sont générées loin du centre de traitement principal ou quand la latence est critique : usines, hôpitaux, centres logistiques, sites distants. Étendre FlexPod vers le edge avec Cisco Unified Edge et le stockage NetApp permet une gestion plus cohérente, plutôt que de multiplier les îlots technologiques indépendants sur chaque site.
Architectures reproductibles face aux environnements bricolés
La collaboration avec NVIDIA donne à l’offre une dimension supplémentaire. NetApp et Cisco ont développé des architectures de référence avec NVIDIA, alignées sur le concept d’AI factories : des environnements conçus pour déployer, concevoir et faire évoluer des charges IA tout en conservant une base technique maîtrisée. Ce n’est pas un simple badge partenaire, c’est une validation de l’architecture de bas en haut.
World Wide Technology joue le rôle de partenaire de validation via son AI Proving Ground. Pour beaucoup d’entreprises, pouvoir tester une architecture avant de l’adopter compte autant que d’en connaître les caractéristiques techniques. L’IA reste un terrain fertile en promesses commerciales, et les équipes achats ont besoin de vérifier la performance réelle avant d’engager des budgets importants.
Ce lancement ne résout pas tous les défis classiques de l’IA en entreprise. Définir des cas d’usage précis, préparer les données, former les équipes, maîtriser les coûts opérationnels, mesurer le retour sur investissement : tout cela reste du travail humain. Mais il traduit un glissement de la question centrale du marché. Ce n’est plus « quel modèle utiliser ? » ; c’est « quelle infrastructure déployer pour exploiter l’IA de façon fiable ? ». FlexPod cherche à répondre à cette deuxième question.
Questions fréquentes sur FlexPod IA
Que proposent concrètement NetApp et Cisco avec FlexPod pour l’IA ?
Des architectures validées et préintégrées pour les charges d’IA en entreprise : stockage NetApp AFX, réseau haute performance Cisco Nexus One, sécurité via Cisco Secure AI Factory et gouvernance des données avec l’AI Data Engine. L’objectif est de réduire la complexité du passage du pilote à la production.
Quels cas d’usage couvrent ces solutions FlexPod IA ?
RAG, recherche sémantique, inférence, assistants internes pour des équipes ou des départements, et edge computing pour des environnements distribués avec des contraintes de latence. Les trois scénarios se déploient indépendamment selon la maturité de l’organisation.
Quel rôle joue NVIDIA dans cette offre ?
NVIDIA a collaboré avec NetApp et Cisco pour développer les architectures de référence, intégrant l’AI Data Platform pour la gestion des données et le Secure AI Factory pour la sécurité. L’ensemble s’aligne sur le concept d’AI factories pour déployer des charges IA à grande échelle.
Pourquoi une infrastructure spécifique est-elle nécessaire pour l’IA en production ?
L’IA en production demande une performance prévisible sur les accélérateurs, un réseau déterministe, une gestion fine des données et une sécurité couvrant accès, conformité et protection des modèles. Ces exigences dépassent largement celles des applications traditionnelles, ce qui rend les environnements bricolés rapidement insuffisants.
Source : NetApp