Google Cloud Next 26 : l’entreprise agentique passe en production

Google Cloud Next 26 entreprise agentique IA en production

Google Cloud a transformé sa conférence Next 26 en un manifeste industriel : l’intelligence artificielle en entreprise n’est plus une couche d’assistance, mais une infrastructure opérationnelle capable d’exécuter des processus, de coordonner des agents, d’interroger des données métier, de renforcer la sécurité et d’agir directement sur les applications corporatives. Selon les chiffres communiqués par Thomas Kurian, directeur général de Google Cloud, près de 75 % des clients cloud de l’entreprise utilisent déjà ses produits d’intelligence artificielle, et ses modèles propriétaires traitent désormais plus de 16 milliards de tokens par minute via un usage direct des API. Le message est limpide : la phase pilote est terminée, place à l’« entreprise agentique ».

Cette inflexion intervient alors qu’AWS, Microsoft Azure et Google Cloud se livrent une bataille frontale pour s’imposer comme la plateforme de référence du déploiement d’agents IA en production. Le cloud n’est plus seulement un stock de machines virtuelles ou un catalogue de bases de données managées : il devient le système nerveux de l’automatisation des processus métier. Et Google, longtemps considéré comme le challenger derrière AWS et Azure, joue désormais sa carte la plus offensive depuis le lancement de Vertex AI.

Gemini Enterprise, le nouveau centre de commandement des agents IA

Le pari central de Google Cloud Next 26 porte un nom : la Gemini Enterprise Agent Platform. Cette plateforme est présentée comme l’évolution naturelle de Vertex AI vers un environnement plus large, conçu pour créer, déployer, gouverner et optimiser des agents d’intelligence artificielle au sein des organisations. Loin d’un simple changement de marque, il s’agit d’un repositionnement stratégique : Google ne vend plus uniquement des modèles ou des outils, il vend une infrastructure d’orchestration agentique de bout en bout.

La plateforme regroupe plusieurs briques techniques : Agent Studio pour la conception, Agent-to-Agent Orchestration pour la coordination multi-agents, Agent Registry pour le catalogue interne, Agent Identity pour l’authentification, Agent Gateway pour le contrôle d’accès et Agent Observability pour la supervision. L’objectif est limpide : éviter qu’une organisation se retrouve avec des dizaines d’agents construits en silo par chaque département, sans contrôle centralisé, sans piste d’audit et sans politique de sécurité commune. Un risque que les RSSI commencent à pointer du doigt depuis que la prolifération du « shadow AI » a remplacé celle du « shadow IT ».

L’application Gemini Enterprise se veut la porte d’entrée quotidienne pour les employés et les clients. Elle intègre Agent Designer, des agents à long terme, une boîte de réception pour gérer l’activité agentique, des projets dotés d’une mémoire contextuelle, des Skills pour les tâches répétitives et un module Canvas permettant de créer et éditer documents et présentations sans quitter l’environnement. La promesse est claire : démocratiser la conception d’agents auprès des profils non techniques, à la manière dont les outils low-code ont démocratisé le développement applicatif il y a une décennie.

Cette ambition rejoint une tendance lourde du secteur. Snowflake a également renforcé son offre Snowflake Intelligence et Cortex Code pour se positionner comme centre névralgique de l’entreprise agentique, et Microsoft pousse Copilot Studio dans la même direction. La bataille ne porte plus sur la qualité brute des modèles, mais sur la capacité à orchestrer, gouverner et industrialiser l’usage des agents à l’échelle.

Contexte et enjeux : pourquoi 2026 est l’année de bascule

Trois facteurs convergent pour faire de 2026 un point d’inflexion. D’abord, la maturité technique : les modèles de raisonnement à long contexte permettent enfin des agents capables de suivre des procédures complexes sur plusieurs heures, voire plusieurs jours. Ensuite, la pression économique : après deux années d’investissements massifs dans l’IA générative, les directions financières exigent un retour mesurable, ce qui suppose des cas d’usage opérationnels et non plus expérimentaux. Enfin, la pression concurrentielle : aucun fournisseur cloud ne peut se permettre de rester en retrait alors que les budgets IA des grandes entreprises atteignent en moyenne 8 à 12 % du budget IT global.

Le passage d’un agent perçu comme un chatbot à un système qui suit des instructions, consulte des sources internes, exécute des tâches, demande une validation humaine quand nécessaire et maintient un contexte sur la durée transforme la nature même du logiciel d’entreprise. Service client, opérations, finance, marketing, support interne, analyse de données, gestion documentaire : tous les domaines fonctionnels sont concernés. Mais à mesure que le nombre d’agents augmente, le contrôle, l’audit et la définition de garde-fous deviennent critiques. La question n’est plus seulement « l’agent répond-il correctement ? », mais « son comportement reste-t-il dans les limites fixées par l’organisation ? ».

Annonce cléApport techniqueImplication stratégique
Gemini Enterprise Agent PlatformConception, orchestration, gouvernance et observabilité des agentsPasser des pilotes isolés à des déploiements contrôlés à l’échelle de l’entreprise
Application Gemini EnterpriseAgent Designer, Inbox, Skills, Projects et CanvasRendre la création et l’usage d’agents accessibles aux collaborateurs non techniques
TPU 8t et TPU 8iNouvelle génération de puces dédiées à l’entraînement et à l’inférenceRenforcer l’autonomie matérielle de Google face à la dépendance NVIDIA
Agentic Data CloudLakehouse multicloud, Knowledge Catalog et Data Agent KitConnecter les agents à des données fiables et contextualisées
Agentic DefenseThreat Intelligence, SecOps et plateforme Wiz intégrésRépondre aux risques inédits posés par les agents en production

TPU 8t et TPU 8i : Google muscle son infrastructure silicium

L’infrastructure constitue le second pilier majeur de l’événement. Google a dévoilé sa huitième génération de TPU avec deux lignes distinctes : TPU 8t, orientée entraînement, et TPU 8i, conçue pour l’inférence à faible latence et l’exécution massive d’agents. Cette segmentation reflète une réalité économique du secteur : la phase d’inférence représente désormais 60 à 70 % des coûts d’exploitation d’un modèle en production, et l’optimiser devient stratégique pour la rentabilité de l’IA en entreprise.

Selon les données communiquées par Google, le TPU 8t peut s’étendre jusqu’à 9 600 unités et 2 pétaoctets de mémoire partagée à haut débit dans un seul superpod. L’entreprise revendique trois fois plus de puissance de calcul que la génération Ironwood et jusqu’à deux fois la performance par watt. Le TPU 8i, dédié à l’inférence, repose sur une nouvelle topologie baptisée Boardfly, avec une connexion directe de 1 152 TPU dans un même groupe. Google annonce 80 % de rendement supplémentaire par dollar en inférence par rapport à la génération précédente. Ces chiffres restent à valider dans des conditions réelles, mais ils traduisent une tendance de fond : l’infrastructure dédiée à l’IA se spécialise et se segmente selon les phases du cycle de vie des modèles.

Google a également renforcé son discours d’ouverture en rappelant que son AI Hypercomputer combine ses TPU internes, ses CPU Axion et les GPU NVIDIA. La société sera parmi les premiers fournisseurs à proposer NVIDIA Vera Rubin NVL72, en complément des instances Blackwell et Hopper déjà disponibles. Cette stratégie hybride contraste avec celle d’AWS, qui pousse fortement ses puces Trainium et Inferentia, et avec Microsoft, qui mise sur Maia. La concurrence sur le silicium dédié à l’IA s’intensifie, et Samsung et TSMC se disputent désormais la fabrication des puces d’inférence de NVIDIA, signe que la guerre se joue aussi à l’amont de la chaîne de valeur.

En matière de stockage, Google a mis en avant Managed Lustre avec jusqu’à 10 To/s de performance vers A5X ou TPU 8t via RDMA, et des améliorations dans Rapid Storage, qui passe de 6 à 15 To/s. Côté réseau, la firme a présenté Virgo Networking, une infrastructure optimisée pour l’IA conçue pour interconnecter Vera Rubin NVL72 ou superpods TPU 8t dans des supercalculateurs réunissant des centaines de milliers d’accélérateurs. Cette course à la bande passante n’est pas anodine : à mesure que les agents enchaînent les appels de modèles et les requêtes de données, la latence réseau devient le facteur limitant principal.

Agentic Data Cloud : connecter les agents aux données métier

La troisième composante de l’annonce, baptisée Agentic Data Cloud, vise à résoudre l’un des points de friction les plus critiques du déploiement agentique en entreprise : l’accès aux données. Google a annoncé un Lakehouse multicloud reposant sur Apache Iceberg, un Knowledge Catalog pour contextualiser les données, un Data Agent Kit pour la science des données assistée par Gemini, et un Deep Research Agent pour l’analyse approfondie en environnement entreprise.

Le constat est simple : si les agents doivent prendre des décisions ou exécuter des tâches, ils ont besoin d’accéder à des données fiables, à jour et significatives pour le métier. Connecter un modèle à un dépôt documentaire ne suffit pas. L’IA doit comprendre les relations entre entités, les permissions, le contexte, les métadonnées et les règles internes. C’est sur cette couche sémantique entre données structurées et non structurées que Google entend se différencier de ses concurrents, en particulier face à Snowflake et Databricks qui occupent historiquement cet espace.

Le choix d’Apache Iceberg comme format de table commun n’est pas neutre. Il signale la volonté d’éviter le verrouillage propriétaire et de jouer la carte de l’interopérabilité, à un moment où les directions IT redoutent par-dessus tout d’enfermer leurs données critiques dans un silo difficilement portable. Cette ouverture est aussi une réponse pragmatique au fait que la majorité des grandes entreprises opèrent désormais en multicloud, avec des données réparties entre AWS S3, Azure Data Lake et Google Cloud Storage.

Agentic Defense : sécuriser un écosystème d’agents en production

La sécurité constitue le quatrième volet, et probablement l’un des plus déterminants pour l’adoption en grand compte. Google a présenté Agentic Defense, une solution combinant Google Threat Intelligence, Security Operations et la plateforme Wiz, acquise récemment. La firme a également annoncé des agents spécialisés pour la détection des menaces, le développement de règles de détection, l’investigation et la remédiation. La logique est cohérente : si les entreprises automatisent leurs processus métier, elles doivent automatiser symétriquement leur défense.

La sécurité des agents s’imposera comme l’un des grands sujets des prochaines années. L’injection d’instructions, l’accès non autorisé à des données sensibles, l’usage abusif d’outils ou les erreurs de raisonnement peuvent avoir des conséquences bien plus graves lorsqu’un agent agit plutôt que de simplement répondre. Un agent compromis qui exécute des virements bancaires ou modifie des configurations cloud n’est plus un incident de support, c’est une crise opérationnelle. C’est pourquoi Google a insisté sur l’identité des agents, les passerelles de contrôle, la défense contre les attaques, la détection d’anomalies et les tableaux de bord de sécurité.

Cette préoccupation rejoint les analyses récentes du secteur. Les recherches de Palo Alto Networks sur l’impact de la Frontier AI sur la cybersécurité montrent que les modèles les plus avancés peuvent être détournés pour automatiser des attaques sophistiquées, ce qui rend indispensable une posture défensive elle aussi automatisée. La symétrie entre attaque et défense agentique deviendra l’un des marqueurs des dépenses cybersécurité en 2026 et 2027.

La productivité bureautique trouve aussi sa place dans cette vision avec Workspace Intelligence, une couche sémantique pour Gmail, Docs, Drive, Meet, Chat, Sheets et Slides. Google veut transformer Workspace en un environnement à contexte partagé, capable de résumer, préparer des documents, organiser des projets et exécuter des tâches via Gemini Enterprise. L’enjeu est concurrentiel : Microsoft 365 Copilot a pris une avance commerciale notable sur ce segment, et Google doit reprendre l’initiative auprès des directions qui hésitent encore entre les deux écosystèmes.

Analyse et implications : une bataille frontale pour le cloud d’entreprise

Google Cloud Next 26 confirme que la compétition cloud entre dans une nouvelle phase. AWS, Microsoft et Google ne rivalisent plus seulement sur les machines virtuelles, le stockage ou les bases de données managées. Ils se mesurent désormais sur leur capacité à devenir la plateforme où les entreprises construisent leurs agents, connectent leurs données, déploient leurs modèles et gouvernent l’automatisation complète de leurs processus.

Pour Google, l’opportunité est double. D’un côté, l’entreprise capitalise sur son expérience historique en modèles, données, recherche, productivité et infrastructure propriétaire. De l’autre, elle doit continuer à grappiller des parts sur un marché du cloud où Microsoft Azure et AWS occupent des positions très solides. Selon Synergy Research, AWS détient encore environ 30 % du marché IaaS mondial, Azure approche 25 % et Google Cloud oscille autour de 12 %. La fenêtre pour s’imposer sur l’orchestration agentique pourrait être l’occasion de redistribuer les cartes.

La proposition de Google est techniquement solide sur le papier, mais elle soulève des questions concrètes pour les clients : coût réel d’exécution à l’échelle, dépendance à la plateforme, intégration avec les systèmes existants, portabilité des agents entre clouds, conformité réglementaire en Europe, souveraineté des données et maturité des outils de gouvernance. Sur le terrain européen, la question de la souveraineté reste un point d’ancrage commercial fort, alors que la Catalogne accélère le déploiement de 26 nouveaux centres de données et que d’autres régions européennes structurent leur capacité pour accueillir l’IA en production.

Perspectives : une transition graduée mais inéluctable

La bascule vers l’« entreprise agentique » ne sera ni immédiate ni uniforme. Certains secteurs adopteront ces systèmes rapidement : la banque pour la conformité et le service client, la distribution pour la personnalisation et la chaîne logistique, les télécommunications pour la gestion réseau, la santé pour la documentation médicale, le service client pour le traitement multicanal. D’autres avanceront plus prudemment, freinés par les contraintes réglementaires, culturelles ou techniques. Les administrations publiques, en particulier, suivront un calendrier propre dicté par les exigences de souveraineté et de transparence algorithmique.

La tendance est néanmoins claire : l’IA en entreprise quitte le terrain de l’assistance individuelle pour entrer dans celui de l’automatisation coordonnée des processus. Les directions IT qui structurent dès maintenant leur architecture agentique — gouvernance, identité, observabilité, sécurité, données — prendront une longueur d’avance significative sur celles qui continueront à empiler des pilotes sans cadre commun. Le ROI de l’IA générative, longtemps insaisissable, commence à se mesurer non plus en gains de productivité diffus mais en processus métier intégralement automatisés.

Google Cloud a présenté à Next 26 une architecture complète pour accompagner cette transition. Il lui reste désormais à transformer cette vision en déploiements réels, sûrs, mesurables et rentables, pour des entreprises qui ne cherchent plus des expérimentations isolées mais des résultats opérationnels concrets. Le rendez-vous est pris pour Google Cloud Next 27 : le secteur jugera alors si l’entreprise agentique a tenu ses promesses ou si elle aura rejoint le cimetière des paradigmes survendus.

Questions fréquentes

Qu’est-ce que la Gemini Enterprise Agent Platform ?

Il s’agit de la nouvelle plateforme de Google Cloud destinée à créer, déployer, gouverner et optimiser des agents d’intelligence artificielle en entreprise. Elle prolonge les capacités de Vertex AI avec de nouvelles fonctions d’orchestration, de sécurité, d’observabilité, d’identité et de gestion centralisée des agents.

Quelle différence entre TPU 8t et TPU 8i ?

Le TPU 8t est conçu pour l’entraînement de modèles d’IA à grande échelle, avec des superpods pouvant atteindre 9 600 unités. Le TPU 8i, lui, est optimisé pour l’inférence à faible latence et l’exécution massive d’agents, avec une topologie Boardfly réunissant 1 152 TPU. Google présente ces deux architectures comme complémentaires sur le cycle de vie des modèles.

Que propose l’Agentic Data Cloud ?

L’Agentic Data Cloud connecte les agents d’IA à des données d’entreprise fiables, contextualisées et disponibles sur différents environnements. Il s’appuie sur un Lakehouse multicloud basé sur Apache Iceberg, un Knowledge Catalog, un Data Agent Kit et des capacités d’analyse approfondie assistées par Gemini.

Pourquoi Google parle-t-il d’« entreprise agentique » ?

L’expression désigne des organisations où les agents d’intelligence artificielle ne se contentent plus de répondre à des requêtes, mais exécutent des processus, coordonnent des tâches, accèdent aux données internes et agissent dans le respect des politiques de sécurité et de gouvernance définies par l’entreprise.

Comment Google se positionne-t-il face à AWS et Microsoft sur l’IA d’entreprise ?

Google mise sur l’intégration verticale : ses propres modèles Gemini, ses TPU, sa pile logicielle Vertex AI et désormais Gemini Enterprise. Face à AWS qui pousse Bedrock et ses puces Trainium, et Microsoft qui s’appuie sur OpenAI et Copilot, Google joue la carte de la cohérence end-to-end et de l’ouverture multicloud via Apache Iceberg et son AI Hypercomputer hybride.

Quels sont les principaux risques de sécurité d’un déploiement agentique ?

Les risques principaux concernent l’injection d’instructions malveillantes, l’accès non autorisé aux données, l’usage détourné d’outils connectés et les erreurs de raisonnement aux conséquences opérationnelles graves. C’est pourquoi Google insiste sur l’identité des agents, les passerelles de contrôle, l’observabilité et la détection d’anomalies via Agentic Defense, qui combine Google Threat Intelligence, SecOps et la plateforme Wiz.

Source : cloud.google.com

le dernier