Google Cloud a transformé sa conférence Next 26 en une déclaration d’intentions : l’intelligence artificielle en entreprise n’est plus simplement une assistance, mais devient une couche opérationnelle capable d’exécuter des processus, de coordonner des agents, de consulter des données, de renforcer la sécurité et d’agir sur des applications corporatives. La société résume cette évolution par une expression qui marquera une grande partie de son discours commercial cette année : l’« entreprise agentique ».
Le message de Thomas Kurian, directeur général de Google Cloud, était clair : la phase expérimentale de l’IA générative commence à céder la place à une étape de déploiement réel dans de grandes organisations. Selon les données communiquées par la société, près de 75 % de ses clients cloud utilisent déjà des produits d’intelligence artificielle de Google, et ses modèles propriétaires traitent plus de 16 milliards de tokens par minute via une utilisation directe d’API par ses clients.
Gemini Enterprise, le nouveau centre de commandement pour agents
Le pari majeur de Google Cloud Next 26 est la Gemini Enterprise Agent Platform, une plateforme conçue pour créer, déployer, gouverner et optimiser des agents d’intelligence artificielle au sein des entreprises. Ce n’est pas seulement un changement de marque : Google la présente comme l’évolution de Vertex AI vers un environnement plus large, où les agents peuvent s’intégrer avec des outils internes, des applications tierces, des données d’entreprise et des systèmes de sécurité.
La plateforme inclut des fonctionnalités telles que Agent Studio, Agent-to-Agent Orchestration, Agent Registry, Agent Identity, Agent Gateway et Agent Observability. Ensemble, ces composantes visent à résoudre l’un des grands défis des entreprises : comment éviter que chaque département crée ses propres agents sans contrôle, sans traçabilité et sans critères de sécurité communs.
Google souhaite que Gemini Enterprise devienne la porte d’entrée de l’IA pour les employés et les clients. L’application intègre Agent Designer, des agents à long terme, une boîte de réception pour gérer l’activité, des projets avec mémoire contextuelle, des Skills pour des tâches répétitives, et Canvas pour créer et éditer des documents et présentations sans sortir de l’environnement.
L’approche est ambitieuse. Un agent n’est plus uniquement perçu comme un simple chatbot, mais comme un système capable de suivre des instructions, consulter des sources internes, exécuter des tâches, demander une validation humaine lorsque nécessaire et maintenir le contexte sur la durée. Cette idée peut être utile dans des domaines tels que le service client, les opérations, la finance, le marketing, le support interne, l’analyse des données ou la gestion documentaire.
Le défi réside cependant dans la complexité. Plus il y a d’agents en fonctionnement dans une organisation, plus le contrôle, l’audit et la définition de limites claires deviennent nécessaires. C’est pourquoi Google insiste beaucoup sur l’identité, l’observabilité, les passerelles de contrôle et la détection d’anomalies. La question n’est plus seulement de savoir si un agent répond correctement, mais si son comportement reste conforme aux limites fixées par l’organisation.
| Zone annoncée | Ce que cela apporte | Pourquoi c’est important |
|---|---|---|
| Gemini Enterprise Agent Platform | Développement, orchestration, gouvernance et observabilité des agents | Passer de déploiements pilotes isolés à des déploiements contrôlés en entreprise |
| Gemini Enterprise app | Agent Designer, Inbox, Skills, Projects et Canvas | Rendre la création et l’utilisation d’agents accessibles aux employés non techniques |
| TPU 8t et TPU 8i | Nouvelle génération de puces pour entraînement et inférence | Renforcer l’infrastructure interne de Google face à la pression de l’IA à grande échelle |
| Agentic Data Cloud | Lakehouse multicloud, Knowledge Catalog et Data Agent Kit | Connecter agents et données fiables avec un contexte d’entreprise |
| Agentic Defense | Intégration de l’intelligence sur les menaces, SecOps et Wiz | Répondre aux nouveaux risques liés aux agents, au cloud, aux données et aux applications IA |
Nouvelles TPU pour entraînement et inférence
L’infrastructure a été le second axe majeur de l’événement. Google a présenté sa huitième génération de TPU avec deux lignes distinctes : TPU 8t, orientée vers l’entraînement, et TPU 8i, conçue pour l’inférence à faible latence et l’exécution à grande échelle des agents.
Selon Google, le TPU 8t peut évoluer jusqu’à 9 600 TPU et 2 pétaoctets de mémoire partagée à haut débit dans un seul superpod. L’entreprise garantit qu’il offre trois fois plus de puissance de traitement que Ironwood, et jusqu’à deux fois la performance par watt. Quant au TPU 8i, il est optimisé pour l’inférence, utilisant une nouvelle topologie appelée Boardfly, avec une connexion directe de 1 152 TPU dans un seul groupe. Google affirme que cette version fournit 80 % de rendement supplémentaire par dollar en inference par rapport à la génération précédente.
Ces chiffres doivent être lus comme des déclarations du fabricant, mais ils illustrent une tendance claire : l’infrastructure dédiée à l’IA se spécialise. Il ne suffit plus d’avoir des accélérateurs puissants pour former des modèles. La phase d’inférence, de raisonnement et d’exécution des agents exige une faible latence, une mémoire efficace, des réseaux rapides, et des coûts mieux maîtrisés.
Google a également renforcé son message d’ouverture en rappelant que son AI Hypercomputer combine ses TPU internes, CPU Axion et GPU NVIDIA. La société a affirmé qu’elle sera parmi les premiers fournisseurs à proposer NVIDIA Vera Rubin NVL72, en plus des instances basées sur Blackwell et Hopper, déjà disponibles ou annoncées dans son portefeuille.
En stockage, Google a mis en avant Managed Lustre avec jusqu’à 10 To/s de performance vers A5X ou TPU 8t via RDMA, et des améliorations dans Rapid Storage, passant de 6 To/s à 15 To/s. Sur le plan réseau, la société a présenté Virgo Networking, une infrastructure optimisée pour l’IA qui vise à connecter des systèmes Vera Rubin NVL72 ou des superpods TPU 8t dans des superordinateurs avec des centaines de milliers d’accélérateurs.
Données, sécurité et productivité : l’IA veut s’intégrer à toute l’activité
La troisième composante de l’annonce concerne Agentic Data Cloud, une architecture conçue pour que les agents puissent travailler avec des données d’entreprise dispersées dans divers systèmes. Google a annoncé un Lakehouse multicloud basé sur Apache Iceberg, ainsi que Knowledge Catalog pour contextualiser les données, Data Agent Kit pour la science des données assistée par Gemini, et Deep Research Agent pour une analyse d’entreprise approfondie.
L’objectif est clair : si les agents doivent prendre des décisions ou exécuter des tâches, ils ont besoin d’accéder à des données fiables, à jour et significatives pour l’entreprise. Il ne suffit pas de connecter un modèle à un dépôt documentaire. L’IA doit comprendre relations, permissions, contexte, métadonnées et règles internes. C’est là que Google cherche à se différencier avec une couche sémantique sur les données structurées et non structurées.
En matière de sécurité, Google a présenté Agentic Defense, une solution combinant Google Threat Intelligence, Security Operations et la plateforme Wiz. La société a également annoncé des agents spécialisés pour la détection des menaces, le développement de détections, l’investigation et la remédiation. Le message est cohérent avec l’expansion des agents : si les entreprises souhaitent automatiser des processus critiques, elles devront également automatiser leur défense.
La sécurité des agents sera l’un des grands sujets de discussion dans les années à venir. Des risques tels que l’injection d’instructions, l’accès non autorisé à des données, l’utilisation abusive d’outils ou les erreurs de raisonnement peuvent avoir des conséquences plus graves lorsqu’un agent ne se contente pas de répondre, mais agit. C’est pourquoi Google a mis l’accent sur l’identity des agents, les passerelles, les défenses contre les attaques, la détection d’anomalies et les tableaux de bord de sécurité.
La productivité a également sa place à travers Workspace Intelligence, une couche sémantique pour Gmail, Docs, Drive, Meet, Chat, Sheets et Slides. Google souhaite que Workspace ne soit plus seulement une suite d’applications mais devienne un environnement doté d’un contexte partagé, capable de résumer des informations, préparer des documents, organiser des projets et exécuter des tâches via Gemini Enterprise.
Une bataille directe pour la nouvelle nuage d’entreprise
Google Cloud Next 26 confirme que la compétition dans le cloud a atteint une nouvelle étape. AWS, Microsoft et Google ne rivalisent plus seulement sur des machines virtuelles, du stockage ou des bases de données. Ils se mesurent désormais pour devenir la plateforme où les entreprises construisent leurs agents, connectent leurs données, déploient leurs modèles et gouvernent l’automatisation complète des processus.
Pour Google, c’est une double opportunité. D’une part, elle peut capitaliser sur son expérience historique en modèles, données, recherche, productivité et infrastructure propriétaire. D’autre part, elle doit continuer à prendre des parts sur un marché du cloud où Microsoft Azure et AWS occupent des positions très fortes.
La proposition de Google est, sur le papier, techniquement solide, mais soulève aussi des questions importantes pour les clients : coût réel, dépendance à la plateforme, intégration avec les systèmes existants, portabilité des agents, conformité réglementaire, souveraineté des données et maturité des outils de gouvernance.
L’évolution vers une « entreprise agentique » ne sera pas immédiate ni uniforme. Certains secteurs adopteront ces systèmes rapidement, comme la banque, la vente au détail, les télécommunications, la sécurité, la santé ou le service client. D’autres auront besoin de plus de temps en raison de contraintes réglementaires, culturelles ou techniques. Cependant, la tendance semble claire : l’IA en entreprise passe de l’assistance individuelle à l’automatisation coordonnée des processus.
Google Cloud a présenté une architecture complète pour accompagner cette transition. Il lui reste à convertir cette vision forte en déploiements réels, sûrs, mesurables et rentables pour des entreprises qui ne cherchent pas seulement des expérimentations isolées, mais des résultats opérationnels concrets.
Questions fréquentes
Qu’est-ce que Gemini Enterprise Agent Platform ?
Gemini Enterprise Agent Platform est la nouvelle plateforme de Google Cloud pour créer, déployer, gouverner et optimiser des agents d’intelligence artificielle en entreprise. Elle intègre les capacités de Vertex AI avec de nouvelles fonctions d’orchestration, de sécurité, d’observabilité, d’identité et de gestion des agents.
Quelle différence y a-t-il entre TPU 8t et TPU 8i ?
Le TPU 8t est destiné à l’entraînement de modèles d’IA à grande échelle, tandis que le TPU 8i est conçu pour l’inférence, avec une faible latence et pour l’exécution massive d’agents. Google présente ces deux architectures comme étant adaptées à différentes phases du cycle de vie de l’IA.
Que propose Agentic Data Cloud ?
Agentic Data Cloud vise à connecter les agents d’IA avec des données d’entreprise fiables, contextualisées et disponibles sur différents environnements. Il comprend un Lakehouse multicloud basé sur Apache Iceberg, un Knowledge Catalog, un Data Agent Kit, ainsi que des capacités d’analyse assistée par Gemini.
Pourquoi Google parle-t-il d’« entreprise agentique » ?
Google utilise le concept d’« entreprise agentique » pour décrire des organisations où les agents d’intelligence artificielle ne se contentent pas de répondre à des questions, mais exécutent des processus, coordonnent des tâches, travaillent avec des données internes et agissent selon des politiques de sécurité et de gouvernance définies par l’entreprise.
source : cloud.google