Uber et AWS : Trainium3 au service du moteur d’IA de la mobilité

Uber étend son accord avec AWS et teste Trainium3 pour son moteur d'IA

Uber a renforcé sa collaboration avec AWS en étendant l’utilisation de Graviton4 pour ses Trip Serving Zones (infrastructure temps réel de chaque trajet/livraison) et en testant Trainium3 pour l’entraînement de modèles IA. Ce dépassement de la simple migration cloud illustre comment Uber choisit le type de silicium le plus adapté à chaque charge. AWS est déjà confronté à une demande énorme pour ses puces maison, comme le montre le fait que deux clients voulaient toute la capacité Graviton en 2026.

Graviton4 pour le temps réel

Les Trip Serving Zones traitent des données de localisation et génèrent des millions de prédictions en millisecondes. Graviton4 réduit la consommation énergétique, accélère la montée en charge et diminue la latence. « Les millisecondes comptent » résume Uber.

Trainium3 en phase pilote

Uber teste Trainium3 pour entraîner des modèles de matching conducteur-passager, estimation de temps d’arrivée et recommandation. C’est un pilote, pas un transfert massif de toute la couche IA. Uber intègre Trainium3 comme option pour développer des modèles plus rapides et efficaces. AWS renforce aussi son infrastructure avec le Project Houdini de centres de données préfabriqués.

Stratégie multicloud maintenue

Uber poursuit son multicloud avec Oracle et Google Cloud (contrats de 7 ans signés en 2023). AWS gagne du terrain sur Graviton4 (traitement général) et Trainium3 (entraînement IA). Choix sélectif selon coût, latence, élasticité et type de matériel. La compétition cloud s’étend aux plateformes à silicium différencié : la compétitivité dépend aussi du chip sous-jacent.

Questions fréquentes

Quels services Uber utilisera-t-il avec AWS ?
Graviton4 pour les Trip Serving Zones et Trainium3 en pilote pour l’entraînement IA.

Uber abandonne-t-il Google Cloud ou Oracle ?
Non. Stratégie multicloud maintenue avec des contrats de 7 ans.

Trainium3 remplace-t-il les GPU ?
Pas encore. C’est un pilote pour certains modèles, positionné comme alternative économique aux GPU NVIDIA.

Quels cas d’usage IA chez Uber ?
Matching, tarification dynamique, estimation temps d’arrivée, recommandation et détection de fraude.

le dernier