Uber a renforcé sa collaboration avec Amazon Web Services (AWS) avec une démarche qui dépasse la simple migration vers le cloud. La société a étendu l’utilisation de l’infrastructure AWS pour transférer davantage de traitements de ses systèmes de correspondance en temps réel vers des instances basées sur Graviton4. Par ailleurs, elle a commencé à expérimenter l’entraînement de certains modèles d’intelligence artificielle sur Trainium3, les puces d’AWS spécialement conçues pour l’apprentissage automatique. Cette évolution est significative car elle illustre comment Uber optimise sa stratégie multicloud en choisissant non seulement le fournisseur, mais aussi le type de silicium le plus adapté à chaque charge de travail.
Selon AWS, Uber utilisera davantage d’instances Graviton4 pour ses Trip Serving Zones, l’infrastructure en temps réel derrière chaque trajet ou livraison, qui traite les données de localisation et génère des millions de prédictions en quelques millisecondes. Par ailleurs, l’entreprise a commencé à tester Trainium3 pour entraîner certains modèles qui permettent de décider quel conducteur ou livreur assigner, d’estimer les temps d’arrivée, ou encore de recommander la meilleure option de livraison à l’utilisateur. Autrement dit, il y a une distinction claire entre l’exploitation immédiate du service et la couche d’apprentissage qui permet d’améliorer ces décisions au fil du temps.
Graviton4 s’impose dans une partie clé du business
La composante la plus avancée de l’annonce concerne Graviton4. AWS indique qu’Uber déplace déjà une partie importante de ses traitements pour les Trip Serving Zones vers cette architecture afin de réduire la consommation énergétique, d’accélérer la montée en charge lors des pics de demande et de diminuer la latence, où quelques millisecondes peuvent impacter directement l’expérience utilisateur. Uber résume cela par la phrase : “les millisecondes comptent”. Dans un secteur où la plateforme doit faire correspondre l’offre et la demande en temps réel, l’efficacité du traitement est cruciale.
Cela s’inscrit dans la logique de la famille Graviton d’AWS, basée sur l’architecture Arm. Depuis plusieurs années, elle est considérée comme une alternative rentable en termes de performance et d’efficacité pour certains workloads cloud. Pour Uber, il ne s’agit pas d’un remaniement total de l’infrastructure, mais plutôt d’une extension ciblée sur l’un des systèmes les plus sensibles de son opération mondiale. Cela indique une stratégie où AWS n’est pas uniquement utilisé comme un fournisseur générique, mais comme une plateforme hardware spécifique offrant des avantages concrets pour certains workloads très optimisés.
Trainium3 en phase pilote, vers une intensification de l’IA
L’autre volet de l’accord est plus expérimental, mais probablement aussi stratégique à moyen terme. Uber a débuté un programme pilote pour l’entraînement de certains modèles d’intelligence artificielle sur Trainium3, l’accélérateur d’apprentissage automatique d’AWS. Selon AWS, ces modèles analysent des données issues de milliards de trajets et de livraisons pour optimiser la correspondance entre usagers et conducteurs, estimer les temps d’arrivée ou encore personnaliser les recommandations. Pour l’instant, la communication d’Amazon insiste sur le fait qu’il s’agit d’un pilote, et non d’un transfert massif de toute la couche d’entraînement IA de Uber vers Trainium3.
Ce détail est important. Sur le marché actuel des chips pour l’IA, peu d’entreprises remplacent immédiatement leurs infrastructures existantes par un nouveau type d’accélérateur, même après des prototypes ou pilotes positifs. Chez Uber, le message semble plus prudent : Trainium3 est intégré comme une option pour construire une base technologique permettant de développer des modèles plus rapides et plus efficaces, sans présenter ce recentrage comme une rupture totale avec les solutions en place.
Une alliance avec AWS sans renier la stratégie multicloud
Ce lancement est aussi intéressant car il n’oppose pas la stratégie multicloud qu’Uber a consolidée en 2023. La société a signé deux contrats de sept ans avec Oracle Cloud Infrastructure et Google Cloud dans le cadre de sa transition progressive hors de ses propres data centers. Oracle a annoncé officiellement une alliance stratégique de sept ans pour accélérer cette migration, tandis que Google a annoncé étendre sa collaboration pour déplacer des applications et des données vers Google Cloud.
L’enjeu n’est donc pas qu’Uber abandonne sa stratégie multicloud, mais qu’elle la peaufine. Google et Oracle restent des partenaires à long terme, tandis qu’AWS gagne du terrain sur un segment où il peut faire la différence : l’utilisation combinée de Graviton4 pour le traitement général et de Trainium3 pour l’entraînement IA. Il ne s’agit pas d’une dépendance exclusive, mais d’un choix plus sélectif en fonction du coût, de la latence, de l’élasticité et du type de matériel disponible.
Ce positionnement reflète la trajectoire récente d’Uber. La société a indiqué dans diverses publications techniques que sa modernisation infrastructurelle vise à améliorer la productivité, accélérer le processus d’ingénierie et optimiser les coûts. Dans ce contexte, étendre l’usage d’AWS pour un volet critique du business n’est pas une rupture, mais une étape cohérente dans une architecture répartie où chaque cloud contribue selon ses atouts.
AWS valorisé par une référence à ses chips maison
Pour AWS, cet accord a aussi une portée symbolique et commerciale importante. Uber n’est pas une startup de petite taille ou un laboratoire de test, mais une plateforme mondiale de mobilité en temps réel avec des millions d’utilisateurs quotidiens et des exigences extrêmes en termes de disponibilité et de latence. Confier davantage de charges à Graviton4 et expérimenter Trainium3 offrent à Amazon une référence forte pour sa stratégie de développement de silicium proprietary. En somme, il ne s’agit pas uniquement de vendre du cloud, mais de prouver que ses puces peuvent soutenir des applications critiques à grande échelle.
Ce partenariat illustre une tendance croissante dans l’infrastructure cloud : la concurrence ne se limite plus uniquement entre fournisseurs, mais s’étend aussi à des plateformes dotées de silicium différencié. Uber a besoin de rapidité, d’élasticité, d’efficacité et d’une base robuste pour continuer à améliorer ses modèles. AWS présente avec Graviton4 pour le traitement général et Trainium3 pour les expérimentations, une voie claire vers une infrastructure où la compétitivité dépend aussi du type de chip sous-jacent. Ce n’est pas encore une transformation complète, mais un pas décisif dans cette direction.
Questions Fréquentes
Quels services Uber utilisera-t-il précisément avec AWS dans ce nouvel accord ?
Uber étendra l’utilisation des instances AWS Graviton4 pour ses Trip Serving Zones et a commencé à expérimenter l’entraînement de certains modèles d’IA sur AWS Trainium3.
Qu’est-ce que les Trip Serving Zones d’Uber ?
Il s’agit de l’infrastructure en temps réel qui gère chaque trajet ou livraison, traitant les données de localisation et générant des millions de prédictions en quelques millisecondes pour faire correspondre utilisateurs et conducteurs ou livreurs.
Ce partenariat implique-t-il que Uber abandonne Google Cloud ou Oracle Cloud ?
Pas du tout. Uber poursuit une stratégie multicloud. En 2023, elle a signé des accords de sept ans avec Oracle et Google Cloud pour migrer hors de ses data centers, tout en maintenant une relation avec ces deux fournisseurs. Ce nouvel accord avec AWS s’inscrit comme une extension ciblée plutôt qu’un remplacement.
Est-ce que Trainium3 va devenir la plateforme principale d’IA pour Uber ?
Pas pour le moment. Uber et AWS parlent d’un pilote pour certains modèles d’IA sur Trainium3. Il s’agit d’un mouvement important, mais en phase de test et sans indication d’une migration complète à court terme.