L’essor des serveurs d’IA : la bataille pour l’informatique entre CPU, GPU et nouveaux accélérateurs

Le marché des serveurs pour les centres de données connaîtra une croissance de 169,3 milliards de dollars d'ici 2028, porté par l'IA et le cloud computing.

L’intelligence artificielle : un tournant stratégique dans l’industrie des serveurs

Dans la course mondiale pour le contrôle de l’intelligence artificielle, les serveurs spécialement conçus pour ces tâches sont devenus le cœur des centres de données. Selon un rapport récent de Bank of America, ces systèmes, appelés serveurs d’IA, se définissent comme des configurations informatiques de base composées d’un processeur central (CPU), d’un ou plusieurs accélérateurs (tels que GPU, ASIC ou XPU) et de la mémoire associée. Bien que leur conception puisse sembler simple, le marché qui les entoure devient de plus en plus complexe, compétitif et stratégique.

Les CPU, toujours indispensables mais en déclin

L’architecture de tout serveur commence par une CPU, mais son poids relatif dans la performance et la valeur totale du système a considérablement diminué ces dernières années. Malgré cela, les expéditions de CPU continuent de croître, soutenues par l’augmentation mondiale du nombre de serveurs. Les prévisions annoncent une hausse, passant de 12,3 millions d’unités en 2023 à plus de 16 millions en 2027.

Traditionnellement, les serveurs utilisent une configuration dual-socket, c’est-à-dire deux CPU par serveur. Cependant, cette disposition est de plus en plus complétée par des accélérateurs prenant en charge les charges de travail les plus exigeantes, notamment en intelligence artificielle et en apprentissage automatique.

Intel perd du terrain face à AMD et ARM

Le rapport de BofA met en évidence la transformation du paysage concurrentiel sur le marché des CPU pour serveurs, signalant qu’Intel, autrefois leader incontesté, cède du terrain face à AMD et à l’architecture ARM. Voici un aperçu par fournisseur :

Intel (INTC)
Jusqu’en 2017, Intel contrôlait plus de 99 % du marché en valeur, grâce à son écosystème robuste et à sa position de leader technique. Cependant, avec les retards dans ses cycles de produits depuis 2018, la société a commencé à perdre des parts de marché au profit d’AMD. Dans le secteur du cloud computing, où le coût total de possession (TCO) est crucial, Intel a perdu une part significative de sa dominance, aujourd’hui inférieure à 50 % sur le marché du cloud, bien qu’il demeure solide dans le secteur traditionnel.

AMD
Le lancement en 2017 des processeurs EPYC basés sur l’architecture Zen a marqué un tournant. AMD a exploité ses cycles de produit plus rapides et ses conceptions basées sur des chiplets, avec un plus grand nombre de cœurs, pour conquérir des parts de marché à Intel, surtout dans le secteur cloud. Actuellement, AMD dépasse 50 % en valeur sur ce segment et devrait atteindre 40 % de part de marché global d’ici 2027.

ARM
Contrairement à Intel et AMD qui utilisent l’architecture x86, les processeurs ARM reposent sur une architecture développée par ARM Holdings, basée au Royaume-Uni. Leur principal avantage réside dans l’efficacité énergétique, les rendant attrayants dans des contextes où le TCO est devenu prioritaire. Bien qu’ils aient historiquement été jugés moins flexibles, des développements récents remettent en question cette idée.

Les grands opérateurs de centres de données (hyperscalers) ont déjà commencé à adopter des CPU ARM développées en interne. Amazon avec Graviton, Google avec Axion et Microsoft avec Cobalt en sont des exemples. De plus, Nvidia a lancé des configurations telles que le rack GB200, combinant une CPU Grace (ARM) avec ses nouvelles GPU Blackwell, se positionnant comme une solution puissante pour les charges d’IA à grande échelle.

Un nouvel équilibre dans les centres de données

L’essor des architectures ARM et la consolidation d’AMD montrent un changement de paradigme dans les centres de données modernes. L’efficacité énergétique, la capacité de scalabilité et le TCO redessinent le paysage technologique, défiant la domination de l’architecture x86 et permettant de nouvelles stratégies de déploiement par les principaux acteurs du secteur.

Ce changement ne touche pas seulement les fabricants de puces, mais également l’ensemble de l’écosystème logiciel, des services cloud et de la gestion des infrastructures. La tendance est claire : les serveurs ne sont plus des systèmes monolithiques dominés par une seule marque ou architecture, mais des plateformes hétérogènes, optimisées pour la nouvelle ère de l’intelligence artificielle.

le dernier