La société slovaque-américaine Tachyum a dévoilé les détails et caractéristiques de son nouveau processeur universel Prodigy fabriqué en 2 nanomètres. Selon l’entreprise, cette puce représentera une avancée générationnelle en termes de performance, d’efficacité et de coût dans le domaine de l’intelligence artificielle et du supercalcul.
Le nouveau Prodigy Ultimate offrira jusqu’à 21,3 fois plus de performance par rack pour les charges de travail en IA que le Nvidia Rubin Ultra NVL576, tandis que la version Prodigy Premium atteindra une performance 25,8 fois supérieure à celle du Rubin 144. Avec cette génération, Tachyum affirme dépasser pour la première fois la barre des 1 000 PFLOPs en inférence, contre seulement 50 PFLOPs pour le Nvidia Rubin.
Une avancée qui repousse les limites de l’informatique actuelle
Selon Tachyum, le nouveau Prodigy permettra d’exécuter des modèles d’IA avec des paramètres plusieurs milliers de fois plus importants que n’importe quelle solution existante, à une fraction du coût. Dans un contexte où les modèles linguistiques atteignent des dimensions massives — ChatGPT-4 compte environ 1,8 billion de paramètres et des systèmes émergents comme BaGauLu atteignent 174 billions — la société envisage une vision encore plus ambitieuse : des modèles intégrant la connaissance complète de l’humanité, avec jusqu’à 10^20 paramètres (100 000 000 de billions).
Tachyum estime que l’exécution de tels modèles avec des technologies traditionnelles coûterait plus de 8 trillions de dollars et nécessiterait 276 gigawatts de puissance. En revanche, sa nouvelle architecture pourrait atteindre des capacités comparables avec un coût estimé à 78 milliards de dollars et une consommation d’1 gigawatt seulement. Une différence colossale qui, si elle se confirme, ouvrirait la course à l’intelligence artificielle à de nouveaux pays et entreprises qui ne peuvent actuellement rivaliser avec les géants de la tech.
Technologie ouverte et engagement vers la standardisation
En plus d’améliorer la performance, Tachyum souhaite démocratiser l’accès à la technologie. L’entreprise prévoit de libérer tout son logiciel en open source, ainsi que sa nouvelle technologie de mémoire, basée sur des composants standard. Cette avancée permettrait de doubler par dix le débit de bande passante disponible dans des modules DIMM conventionnels, et faciliterait leur licence à des fabricants de mémoire ou de processeurs, avec la perspective d’une adoption par le consortium JEDEC, qui définit les standards de mémoire.
En 2023, l’entreprise avait déjà lancé ses types de données Tachyum AI (TAI) et mis à disposition des tiers son noyau TPU en licence. La prochaine étape consiste également à ouvrir son architecture d’ensemble d’instructions (ISA), renforçant ainsi la philosophie d’interopérabilité qui caractérise Prodigy.
Prodigy 2 nm : architecture, puissance et efficacité
Le nouveau processeur en 2 nanomètres marque une refonte profonde de la plateforme initiale de Tachyum. La miniaturisation diminue considérablement la consommation d’énergie et améliore la densité, en intégrant 256 noyaux haute performance de 64 bits par chiplet. Chaque module peut contenir plusieurs chiplets, augmentant ainsi la puissance de calcul totale sans alourdir les coûts.
Selon l’entreprise, cette évolution multiplie :
- Par 5 la performance en calculs entiers.
- Par 16 la performance en IA.
- Par 8 le débit de mémoire DRAM.
- Par 4 la connectivité entre puces et entrées/sorties.
- Par 2 l’efficacité énergétique.
Le Prodigy Ultimate intègre 1 024 noyaux, 24 contrôleurs DDR5 à 17,6 GT/s et 128 lignes PCIe 7.0, atteignant ainsi des niveaux de supercalculateurs exa-scaling.
La version Prodigy Premium, avec entre 512 et 128 noyaux, dispose de 16 canaux DDRAM et supporte des configurations jusqu’à 16 sockets.
La gamme Entry-Level, conçue pour des serveurs compacts et de edge computing, sera proposée avec 32 à 128 noyaux et entre 4 et 8 contrôleurs mémoire.
Compatibilité totale et déploiement immédiat
Un des points clés du potentiel succès de Prodigy réside dans sa compatibilité avec les architectures existantes. Tachyum a conçu le système pour exécuter des binaires x86 d’Intel ou AMD sans modification, tout en permettant de mélanger applications natives et logiciels hérités dans un même environnement.
La société fournira à ses clients un ensemble complet de système d’exploitation, compilateurs, bibliothèques, frameworks d’IA et outils HPC, prêts à l’emploi dès le premier jour, ce qui facilitera leur adoption rapide et aisée, en supprimant la plupart des barrières habituelles.
Investissement, calendrier et marchés cibles
Avec une financement récent de 220 millions de dollars, Tachyum a d’ores et déjà sécurisé le financement de la phase de conception et validation (tape-out). Les premiers processeurs seront destinés à la supercalcul, l’IA de grande ampleur, l’analyse de données, la cryptomonnaie, le cloud computing, les bases de données et les environnements à très grande échelle.
L’objectif est que Prodigy devienne un processeur universel, capable de remplacer CPU, GPU HPC et accélérateurs d’IA dans un seul composant, réduisant ainsi à la fois les CAPEX et les OPEX des centres de données.
« Avec le financement déjà assuré pour la phase de conception, le premier processeur universel du monde entre en phase de production. Conçu pour dépasser les limitations inhérentes aux centres de données actuels », a déclaré Dr. Radoslav Danilak, fondateur et CEO de Tachyum.
« Les versions Prodigy Premium et Ultimate amélioreront les charges de travail grâce à une performance supérieure et un coût moindre par rapport à toute autre solution du marché. »
Impact sur la course mondiale à la IA
La présentation intervient dans un contexte de course technologique entre les États-Unis et la Chine, où la puissance de calcul est devenue un enjeu géostratégique majeur. Alors que des géants comme Nvidia, AMD ou Intel rivalisent pour dominer le marché des GPU et des accélérateurs, Tachyum mise sur briser le paradigme, en unifiant tous les types de processeurs dans une seule architecture universelle.
Si les chiffres avancés se confirment, Prodigy 2 nm pourrait se positionner très en avance en termes de performance par watt, avec 21 fois plus de capacité par rack que les dernières GPU de Nvidia, ainsi qu’une efficacité énergétique sans précédent. Dans un contexte où la consommation électrique des centres de calcul d’IA menace leur stabilité, un tel saut pourrait avoir des impacts directs sur les coûts et la durabilité.
Le processeur universel : une réalité plus proche
La vision de Tachyum dépasse le hardware. Son Prodigy vise à intégrer CPU, GPU HPC et accélérateurs d’IA dans un seul processeur programmable capable d’exécuter tout type de charge de travail. Lors de tests internes, l’entreprise affirme avoir obtenu 3 fois plus de performance que les processeurs x86 les plus puissants, et 6 fois plus de performance HPC que les GPU GPGPU actuels.
Avec cette démarche, Tachyum cherche à offrir une flexibilité maximale aux opérateurs cloud, en réduisant le nombre de serveurs nécessaires et en augmentant l’utilisation moyenne de chaque rack. Le résultat attendu : une réduction drastique du coût total de possession et une densité de puissance accrue dans les centres de données.
Un défi direct aux géants de la Silicon Valley
L’émergence de Tachyum ne passera pas inaperçue. Ses promesses de performance et d’ouverture technologique ciblent une concurrence directe avec Nvidia, AMD et Intel sur les trois marchés stratégiques : IA générative, serveurs d’entreprise et supercalcul HPC.
Alors que le secteur attend la publication des spécifications complètes du Prodigy 2 nm, prévue pour la semaine prochaine, analystes et gouvernements continueront de suivre de près comment un acteur émergent s’efforcera de redéfinir l’équilibre mondial dans l’infrastructure de l’intelligence artificielle.
Foire aux questions (FAQs)
Qu’est-ce que le processeur Prodigy 2 nm de Tachyum ?
C’est une puce universelle qui combine dans une architecture ouverte les fonctions de CPU, GPU HPC et accélérateur d’IA, avec une fabrication en processus de 2 nanomètres.
Pourquoi est-il considéré comme révolutionnaire ?
Parce qu’il promet de dépasser les 1 000 PFLOPs en inférence — 20 fois plus que les GPU Nvidia Rubin — ainsi qu’un coût et une consommation énergétique bien inférieurs.
Sera-t-il compatible avec le logiciel existant ?
Oui. Prodigy pourra exécuter des binaires x86 d’Intel ou AMD sans modifications et permet de combiner applications natives et logiciels hérités, facilitant son intégration immédiate dans les serveurs.
Quand sera-t-il disponible ?
Après avoir assuré le financement du tape-out, la production est prévue pour 2026. Les premières unités seront destinées aux centres de calcul, à la supercalification et aux grands modèles d’IA.
source : tachyum