Course à la suprématie de l’IA générative : le choc des titans entre Google, Nvidia et Intel

Le test public majeur évaluant la capacité des systèmes informatiques à former des réseaux neuronaux d’apprentissage automatique a franchi un nouveau palier dans la course à la suprématie de l’IA générative. MLPerf, ayant déjà introduit un test pour la formation de grands modèles de langage (LLM) tels que GPT-3 plus tôt cette année, a récemment intégré Stable Diffusion, un générateur de texte en image, dans ses références. Les géants de l’informatique, Intel et Nvidia, ont répondu à l’appel en utilisant des ordinateurs massifs pour relever ce nouveau défi. Tandis que Google s’est joint à la bataille déjà intense dans la formation GPT-3.

Dans cette compétition, où la taille compte, Nvidia a maintenu sa suprématie avec ses systèmes basés sur les GPU H100. Il dépasse même ses propres réalisations avec le supercalculateur Eos, alimenté par 10 752 GPU. Cette machine monumentale a accompli la tâche du benchmark de formation GPT-3 en moins de 4 minutes. Elle surpasse de peu le système équivalent d’Azure, la branche cloud computing de Microsoft. Ces résultats mettent en lumière la nécessité cruciale de la mise à l’échelle efficace dans le domaine de l’IA générative, dont la croissance exponentielle atteint une multiplication par dix chaque année.

Intel redéfinit les performances de l’IA avec Gaudi 2

https://www.youtube.com/watch?v=BM6CPg3SJz8&pp=ygVAR29vZ2xlLCBJbnRlbCBhbmQgTnZpZGlhIGJhdHRsZSBpdCBvdXQgaW4gZ2VuZXJhdGl2ZSBBSSB0cmFpbmluZw%3D%3D

Intel, de son côté, a présenté des résultats impressionnants dans cette course à la suprématie de l’IA générative. Il a utilisé la puce accélératrice Gaudi 2 et en activant les capacités à virgule flottante (FP8). Avec cette nouvelle puce, Intel a réussi à réduire de 103 % le temps de formation pour un cluster de 384 accélérateurs.

Cette avancée place le Gaudi 2 à environ un tiers de la vitesse d’un système Nvidia par puce. Cela tout en offrant un avantage considérable en termes de prix et de performances.

Intel prévoit cependant d’accentuer cet avantage avec la prochaine génération de sa puce accélératrice, le Gaudi 3, attendu en 2024.

Les systèmes basés sur Xeon accélèrent le raffinement des réseaux neuronaux

Au-delà des benchmarks MLPerf, Intel a également démontré que ses systèmes basés uniquement sur des processeurs, tels que le Xeon de quatrième génération, peuvent réaliser des temps de formation impressionnants.

La société a également partagé des données montrant qu’un système Xeon à 4 nœuds, doté du moteur matriciel AMX, peut affiner le générateur d’images à diffusion stable en moins de 5 minutes. Ce processus est alors essentiel pour spécialiser les réseaux neuronaux dans des tâches spécifiques.

Au total, les résultats de plus de 200 essais provenant de 19 entreprises et institutions ont été soumis à MLPerf. Ce qui a permis de révéler une amélioration de la performance de 2,8 fois au cours des cinq derniers mois. Mais aussi de 49 fois depuis les débuts de l’organisation il y a cinq ans.

Cliquez pour commenter

Laisser un commentaire

ARTICLES SIMILAIRES

Community manager Reddit IoT : un métier d’avenir pour les pros de la tech

Le secteur des technologies intelligentes progresse rapidement à l’échelle mondiale. Pour accompagner cette révolution digitale,

8 juin 2026

Qwant : que faut-il savoir de ce moteur de recherche ?

Qwant : que faut-il savoir de ce moteur de recherche ?

Qwant est le moteur de recherche français emblématique qui a fait le choix radical de ne jamais

8 juin 2026

Laposte.net mail demeure une messagerie viable aujourd’hui si vous appliquez ces réglages

La messagerie laposte.net mail demeure un outil central pour des millions d’utilisateurs en France. Pourtant, ses règles

7 juin 2026

Agence Reddit SEO et LLM : les 7 meilleures agences

La publicité payante classique ne suffit plus pour s’imposer sur Reddit. Il faut déployer une

6 juin 2026

L’humain dans la boucle ne doit pas devenir un simple tampon d’approbation

Avec la montée rapide des agents d’intelligence artificielle dans les entreprises, la place réelle de

6 juin 2026

Acheter des commentaires Reddit, l’erreur fatale que les marques IoT commettent encore

Vous croyez qu’acheter des commentaires sur Reddit peut donner un coup de boost à votre

5 juin 2026