
UC San Diego renforce sa recherche en inférence de LLM avec un système NVIDIA DGX B200
La course à la mise en service de modèles de langage à faible latence ne se résume plus seulement à des articles et des benchmarks : de plus en plus, la victoire se joue dans le laboratoire de systèmes, où le goulet d’étranglement réside souvent dans la façon dont le modèle est « servi » en production. Dans ce contexte, le Hao AI Lab de l’Université de Californie à San Diego (UC San Diego) a intégré un système NVIDIA DGX B200 pour accélérer ses travaux sur l’inférence de grands modèles, une infrastructure également accessible à la communauté universitaire via le San Diego Supercomputer Center. Cette actualité dépasse le simple battage autour du « nouveau matériel » : plusieurs approches, aujourd’hui




