Nvidia dévoile une nouvelle puce dédiée à l'intelligence artificielle générative
Il y a cinq ans, ils n’étaient que 9.000 à assister à la GTC. Cette année, plus de 300.000 personnes doivent participer, en présentiel ou en ligne, à cet évènement organisé par Nvidia, qui se tient jusqu’à jeudi à San José, en Californie. Ce qui n’était alors qu’une conférence destinée à quelques milliers de développeurs très spécialisés est devenu le “Woodstock de l’intelligence artificielle”, selon l’expression popularisée par un analyste de Bank of America. Autrement dit, un rendez-vous incontournable pour l’ensemble du secteur technologique. Et le symbole de l’importance prise par le fabricant américain de cartes graphiques (GPU) dans l’essor de l’IA générative. Lundi, la présentation d’ouverture de Jensen Huang, son charismatique patron, était ainsi autant attendue, si ce n’est plus, qu’une keynote d’Apple.
Nouvelles puces – Comme prévu, Nvidia a dévoilé sa prochaine architecture de puces dédiées à l’entraînement des modèles d’IA, un processus qui nécessite une gigantesque puissance de calcul que seule l’informatique dite “accélérée” peut apporter. Baptisée Blackwell, en hommage à un mathématicien américain, celle-ci affiche des performances bien supérieures à l’architecture Hopper, sur laquelle est bâti son GPU H100, la référence actuelle du secteur. La commercialisation d’une première puce, baptisée B200, doit débuter en fin d’année. Une “super puce” couplant deux GPU avec un processeur (CPU) a également été annoncée, tout comme un nouveau “super ordinateur”, contenant 576 GPU et 288 CPU… Comme à son habitude, la société n’a pas communiqué de prix catalogue. Les puces H100 sont vendues entre 25.000 et 40.000 dollars.
Modèles plus gros – Cette nouvelle architecture doit permettre de répondre aux besoins toujours plus élevés de puissance informatique, à mesure que les modèles cherchent à gagner en taille. “Hopper est fantastique mais nous avons besoin de plus gros GPU”, souligne Jensen Huang. Nvidia promet ainsi de pouvoir entraîner des modèles comptant jusqu’à 10.000 milliards de paramètres, là où GPT-4, la dernière version du grand modèle de langage d’OpenAI, n’en totalisait que 1.700 milliards. La société met aussi en avant des gains de temps, tant pour l’entraînement que pour l’inférence (le processus de génération de textes ou d’images). Et d’importantes économies d’énergie. Les grands acteurs du cloud, dont Microsoft, Amazon et Google, seront parmi les premiers à recevoir ces nouveaux produits.
Concurrence – L’objectif de Nvidia est également de conserver une longueur d’avance technologique sur une concurrence qui commence à émerger. En décembre, AMD a lancé son premier accélérateur dédié à l’IA générative – Microsoft et Meta font partie de ses premiers clients. Intel pourrait suivre AMD dès cette année. Microsoft, Google, Amazon et Meta développent aussi des puces d’IA, mais essentiellement pour un usage interne. Et de nouveaux acteurs pourraient émerger, alors que Sam Altman, le patron d’OpenAI, le concepteur de ChatGPT, et Masayoshi Son, à la tête du conglomérat japonais Softbank, cherchent chacun des fonds pour se lancer. En attendant, Nvidia devrait continuer d’enregistrer une croissance spectaculaire. Au quatrième trimestre 2023, son chiffre d’affaires a été multiplié par près de trois. Et ses profits par près de neuf.
Pour aller plus loin:
– L’IA générative propulse Nvidia vers de nouveaux sommets
– ASML lance une machine à 350 millions pour graver les prochaines puces
En retard sur l'IA générative, Apple négocie avec... Google
Souvent ennemis depuis la “trahison” d’Eric Schmidt*, Apple et Google savent aussi être des partenaires commerciaux quand nécessaire. Selon l’agence Bloomberg, les deux géants américains, qui ont déjà noué un partenariat dans la recherche en ligne, ont ainsi entamé des “négociations actives” autour de l’intelligence artificielle générative. Celles-ci portent sur l’intégration des modèles Gemini, conçus par le moteur de recherche, dans les prochains iPhone, qui doivent être les premiers à ajouter des fonctionnalités d’IA au sein du système d’exploitation iOS. Un tel accord représenterait un cruel désaveu pour le groupe à la pomme, prouvant qu’il peine à rattraper son retard au démarrage dans le domaine, malgré les discours optimistes de ses dirigeants. Apple discuterait également avec OpenAI, le concepteur de ChatGPT.
Samsung en avance – Début février, son patron Tim Cook assurait “investir énormément de temps et d’efforts” dans l’IA générative. Et pour cause: la technologie est considérée comme la prochaine avancée majeure sur le marché des smartphones, capable de relancer des ventes en baisse depuis trois ans. Le mois dernier, au Mobile World Congress de Barcelone, les fabricants ont ainsi rivalisé en annonces: assistant personnel, retouche photos, rédaction de messages, résumé d’une page Web… Parmi eux, Samsung, le grand rival d’Apple, a mis l’intelligence artificielle au cœur de la campagne de communication autour de ses derniers Galaxy S. Mais le groupe américain ne devrait, lui, pas communiquer avant sa conférence WWDC en juin, pour un lancement en septembre, date de déploiement de la prochaine version d’iOS.
Modèles moins performants – N’ayant pas anticipé le spectaculaire essor de l’IA générative, Apple avait pour objectif d’être prêt pour la sortie des nouveaux iPhone. En interne, un chatbot reposant sur un grand modèle de langage baptisé Ajax est ainsi testé depuis plusieurs mois. Mais ses capacités sont inférieures aux services les plus performants du marché, conçus par OpenAI ou Google. Pour ne pas être distancé par Samsung, qui s’appuie sur les modèles de Google, le groupe de Cupertino n’a ainsi pas d’autres possibilités que de nouer un partenariat. Selon Bloomberg, ses technologies internes ne seraient utilisées que pour des tâches basiques, uniquement en local. Les fonctionnalités plus complexes, comme la retouche photo ou le résumé de documents, seront réalisées dans le cloud en passant par des modèles externes.
Facture élevée – Un accord avec Google, OpenAI ou un autre spécialiste du secteur ne signifierait pas pour autant qu’Apple va abandonner ses efforts dans l’IA. Il est en effet très probable que cette période ne soit que transitoire, peut-être même limitée à un an, le temps de développer des modèles compétitifs. L’enjeu financier est potentiellement important: la société va devoir verser d’importantes royalties à son partenaire. Avec plus de deux milliards d’utilisateurs de terminaux iOS, la facture pourrait rapidement monter. S’y ajouteront les coûts d’inférence de l’IA, liés à l’utilisation d’une plateforme de cloud – potentiellement Google Cloud. Comme ses rivaux, Apple espère, à terme, pouvoir faire tourner ses propres modèles en local, c’est-à-dire directement sur les processeurs de ses iPhone.
—
* L’ancien patron de Google a siégé au sein du Conseil d’administration d’Apple entre 2006 et 2009, démissionnant juste avant le lancement du système Android. Steve Jobs, le fondateur du groupe à la pomme, avait alors promis de mener une “guerre thermonucléaire” contre le moteur de recherche.
Crédit photos: Nvidia - Apple