
NVIDIA se vante (con cifras) en la era MoE: Signal65 estima que GB200 NVL72 puede ser hasta 15× más rentable por token que AMD MI355X
La discussion sur l’infrastructure de l’intelligence artificielle s’éloigne de plus en plus du simple « rendement brut » pour se concentrer sur un aspect bien plus tangible : combien coûte le service de chaque token lorsque l’utilisateur exige des réponses rapides, à grande échelle, tout en conservant une bonne « sensation » d’interaction. Dans ce contexte, les modèles MoE (Mixture of Experts / Mélange d’Experts) poussent l’industrie vers un défi complexe : la communication entre nœuds et la latence interne deviennent presque aussi cruciaux que la puissance de calcul. Dans cette optique, la société Signal65 a publié une analyse centrée sur ce qu’elle appelle « la nouvelle économie de l’inférence » pour les MoE, comparant les plateformes de NVIDIA et




