
FuriosaAI et Broadcom préparent une puce IA à 2 nm pour l’ère de l’inférence
FuriosaAI a annoncé un partenariat avec Broadcom pour développer sa troisième génération d’accélérateurs d’IA. Objectif : une plateforme conçue exclusivement pour l’inférence à grande échelle et les charges agentives. La société sud-coréenne n’emprunte pas la voie des GPU généralistes. Elle mise sur une architecture chiplet avec un die de calcul à 2 nanomètres, de la mémoire HBM4/HBM4E, et les technologies réseau de Broadcom pour passer à l’échelle dans les grands centres de données. L’annonce tombe au moment où l’industrie regarde au-delà de l’entraînement des modèles. La prochaine phase sera celle d’une inférence massive : des millions d’utilisateurs, des agents IA qui exécutent des tâches, des modèles multimodaux, une génération continue de tokens. Dans ce contexte, ce n’est pas toujours la




