Vent de panique dans l'IA
La start-up chinoise DeepSeek rebat les cartes du secteur. Et symbolise un échec du modèle américain
Cette édition est présentée par Enky, la start-up belge qui vous propose d’investir dans des projets d'ameublement durable offrant un rendement allant jusqu’à 8,5%.
DeepSeek, la start-up chinoise qui rebat les cartes de l'IA
Une véritable onde de choc. La semaine dernière, le laboratoire chinois DeepSeek a lancé un grand modèle de langage rivalisant avec les meilleurs du marché, mais n’ayant coûté que quelques millions de dollars à concevoir. De quoi faire voler en éclats les certitudes du secteur de l’intelligence artificielle générative, en particulier aux États-Unis, persuadés de leur supériorité technologique. Celles d’OpenAI ou de Meta, lancés dans une course à l’armement pour se doter d’une immense puissance de calcul informatique, devant leur permettre d’entraîner et faire tourner les prochains modèles. Celles de Microsoft, d’Amazon ou de Google, qui investissent massivement pour accroître les capacités de leur offre de cloud. Et aussi celles de Nvidia, leader incontesté des cartes graphiques (GPU), dont l’action a chuté lundi de 17%.
Premier sur l’App Store – Longtemps inconnu, DeepSeek avait déjà suscité la curiosité fin décembre, avec un premier modèle, baptisé V3. Mais le laboratoire, créé il y a moins de deux ans, est entré dans une nouvelle dimension avec un modèle de raisonnement, appelé R1. Sur la plateforme Hugging Face, celui-ci caracole en tête des modèles open source les plus téléchargés par les développeurs. Sur l’App Store, DeepSeek vient de détrôner ChatGPT de son statut d’application mobile la plus populaire aux États-Unis. Comparaisons à l’appui – des données à toujours prendre avec précaution –, le groupe chinois revendique des performances similaires, voire supérieures, aux modèles équivalents d’OpenAI, Meta ou Anthropic. Il n’a pourtant pas accès aux GPU les plus puissants de Nvidia, considérés jusqu’à présent comme indispensables.
5,6 millions de dollars – À l’automne 2022, les États-Unis ont en effet imposé de sévères restrictions sur les exportations de puces vers la Chine. Dans un article de recherche, DeepSeek explique ainsi avoir utilisé des puces H800 de Nvidia, une version bridée pour passer sous les seuils de puissance fixés par Washington. Pour rivaliser avec les groupes américains, qui bénéficient d’une puissance de calcul bien supérieure, le laboratoire a donc dû innover. Il a délaissé la méthode d’apprentissage auto-supervisé. À la place, il a simplement utilisé une technique appelée apprentissage par renforcement, qui doit permettre à une IA de réfléchir seule. Résultat: DeepSeek assure que l’entraînement de son modèle V3 n’a coûté que 5,6 millions de dollars, soit une toute petite fraction des centaines de millions dépensés par OpenAI et les autres.
Menace – Ces chiffres sont impossibles à vérifier. Mais ils suscitent déjà un vent de panique dans la Silicon Valley et à Wall Street. Et pour cause: les avancées de DeepSeek menacent tout le modèle d’investissement qui s’est mis en place depuis deux ans. Le danger ne vient pas nécessairement du laboratoire de recherche, ou d’autres start-up chinoises. D’abord, parce que ses modèles sont soumis à la censure chinoise. Ensuite, parce qu’il sera probablement rattrapé par le RGPD européen sur l’envoi de données vers la Chine. Enfin, parce qu’il pourrait tout simplement être interdit pour des raisons de sécurité, en particulier aux États-Unis. Le danger pour les acteurs en place, c’est davantage que les modèles de DeepSeek, disponibles en open source, ou sa méthode d’entraînement se diffusent à l’ensemble de l’écosystème.
Retour sur investissement – Ce scénario devrait se traduire par une baisse des prix, alors que la start-up chinoise vend l’accès à ses API (interfaces de programmation) dix fois moins cher. Et par une intensification de la concurrence, avec des rivaux plus petits qui ne seront plus limités par leurs ressources financières. Dans ces conditions, comment OpenAI ou Anthropic pourront rentabiliser les investissements qui ont déjà réalisés ? Même question pour les géants du cloud, qui ont dépensé sans compter pour anticiper d’un bond de la demande. Ces nouveaux modèles demanderont en effet moins de puissance pour être entraînés et pourront tourner en local, directement sur un ordinateur ou un smartphone. Et comment Nvidia va pouvoir continuer à vendre toujours plus de GPU à des prix très élevés ? Ou ASML avec ses machines de lithographie ?
Pour aller plus loin:
– “L’IA ? La plus grande bulle de tous les temps”
– Dans l’IA, des start-up prometteuses sont devenues des start-up zombies
Avec Enky, investissez dans des projets d'ameublement durable
Depuis quatre ans, Enky démocratise une nouvelle façon de penser le mobilier commercial. Son credo: la location flexible de mobilier haut de gamme, neuf ou reconditionné, disponible par abonnement.
La start-up a déjà séduit des entreprises de renom comme Kymono, Xpollens et le groupe BPCE. Afin de financer le mobilier de ses clients, Enky propose d'investir dans les projets d'ameublement et de bénéficier d'un rendement très attractif allant jusqu’à 8,5% !
En plus d'un rendement attractif, votre investissement a un impact positif réel. Vous soutenez l'économie circulaire, promouvez le mobilier responsable et contribuez à réduire les déchets mobiliers. Un investissement qui a du sens, tant pour votre portefeuille que pour la planète.
Enky Invest est accessible à partir de 500 euros seulement. Cafétech vous fait bénéficier d'un crédit allant de 100 à 300 euros en fonction du montant investi.
DeepSeek, symbole d’un échec du modèle américain dans l’IA
Dans son style provocateur, Alex Karp avait déjà déclaré la fin de la guerre. “Les États-Unis sont au tout début d’une révolution qui nous appartient: la révolution de l’intelligence artificielle. On devrait l’appeler la révolution américaine de l’IA”, avait-il lancé en décembre, au cours d’une conférence consacrée à la défense. Peu d’observateurs pouvaient alors imaginer que cette déclaration le rattraperait à peine deux mois plus tard, tant la domination des groupes américains était évidente, de la conception des modèles aux cartes graphiques dédiées, en passant par les plateformes de cloud. Sans compter l’accès à des capitaux beaucoup plus importants. S’il pensait surtout à la faible concurrence européenne, ne manquant pas de critiquer un excès de régulation, le dirigeant avait complètement négligé de potentielles avancées chinoises.
Restrictions d’exportation – Les prédictions d’Alex Karp se sont fracassées sur une nouvelle réalité: des acteurs chinois peuvent désormais rivaliser. C’est le cas de DeepSeek, mais aussi de ByteDance, la maison mère de TikTok, ou encore de la start-up Moonshot AI. Pas grand monde n’avait anticipé un tel scénario. Et pour cause: depuis l’automne 2022, la Chine est ciblée par de sévères restrictions d’exportation. Théoriquement, plus aucune entreprise du pays ne peut mettre la main sur les dernières cartes graphiques de Nvidia, considérées comme indispensables pour entraîner les modèles d’IA les plus performants. Ni utiliser les logiciels EDA qui auraient pu permettre de concevoir des GPU alternatifs. Et aucun fondeur ne peut acheter les machines de lithographie les plus sophistiquées d’ASML, qui auraient pu permettre de les graver.
Failles – Les progrès de DeepSeek et des autres démontrent les limites des sanctions américaines. Le laboratoire de recherche explique avoir utilisé des puces H800 de Nvidia, conçues spécifiquement pour échapper aux restrictions de Washington, Depuis, le gouvernement américain a bien réagi, en abaissant encore le seuil de puissance limite. Mais Nvidia a immédiatement répliqué, avec de nouveaux GPU, plus performants dans certains domaines, selon le cabinet spécialisé SemiAnalysis. D’autres failles existent, comme l’utilisation de sociétés écrans basées à l’étranger. Ou alors le recours autorisé à des plateformes de cloud, mêmes américaines. En outre, Huawei s’est joué des sanctions pour concevoir un accélérateur d’IA, que le fondeur SMIC est parvenu à graver en maximisant le potentiel des machines-outils qu’il possédait déjà.
L’échec d’un modèle – Surtout, les offensives de Washington ont poussé les groupes chinois à penser autrement. DeepSeek a ainsi réimaginé la méthode d’entraînement. Enfermé dans leur système de pensée, aucun spécialiste occidental n’y avait songé. Pourquoi ? Parce que le modèle de développement de l’IA a été poussé par Microsoft et Google, avance Steven Sinofsky, l’ancien patron de Windows. Et leur objectif était surtout de vendre de la puissance informatique dans le cloud. OpenAI, Anthropic et les autres n’ont ainsi cherché qu’à “optimiser certains éléments sans avoir une vision d’ensemble”, estime-t-il. Cet épisode est aussi un échec de l’oligopole qui s’est installé dans la tech américaine, comme prévenait Lina Khan, l’ex patronne de la FTC. Ces géants ne cherchent plus à innover, assurait-elle, mais seulement à maintenir leur position dominante.
Pour aller plus loin:
– Comment les États-Unis veulent transformer l’IA en arme géopolitique
– OpenAI anticipe cinq milliards de dollars de pertes
Crédit photos: DeepSeek -Nvidia
Merci pour cet article. Et attendons d’avoir un peu de recul pour voir si le mode de fonctionnement de DeepSeek est viable. Sinon, cette affaire est vraiment instructive: Sur le comportement des grands de la Tech, sur la créativité dont a du faire preuve la Chine, et sur le « suivisme » de l’Europe. Comme quoi les contraintes ça exacerbe la créativité et le « thinking out of the box ».