La face cachée d'OpenAI
Et aussi: La presse divisée face à l'IA - Nouvel accord de licence pour Reddit
Les polémiques se multiplient autour d'OpenAI
Il y a six mois, en officialisant l’éviction abrupte et inattendue de Sam Altman, réinstallé à son poste à peine cinq jours plus tard, le conseil d’administration d’OpenAI reprochait au dirigeant de ne pas avoir été “toujours honnête”. Ses critiques les plus fervents l’accusaient alors d’être “manipulateur et fourbe”, selon des propos rapportés par le New Yorker. Et aussi de ne pas en faire suffisamment, malgré les discours de façade, pour chercher à comprendre et à limiter les risques liés aux progrès exponentiels de l’intelligence artificielle. L’histoire semble désormais leur donner raison. Ces dernières semaines, plusieurs polémiques ont en effet apporté un éclairage parlant sur la face cachée du concepteur de ChatGPT et de son charismatique patron, désormais débarrassé de toute voix discordante au sommet de la start-up.
Équipe dissoute – Exit notamment Ilya Sutskever, le directeur scientifique qui incarnait une approche plus prudente du développement de l’IA. Il a démissionné mi-mai, quelques jours à peine après la présentation d’un nouveau modèle, baptisé GPT-4o, aux fonctionnalités décuplées. Dans la foulée, l’équipe de “super alignement”, qu’il codirigeait, a été démantelée par OpenAI. Celle-ci avait été lancée à l’été 2023 pour s’assurer que la technologie reste sous contrôle, avec la promesse de pouvoir utiliser 20% de la puissance de calcul détenue par la start-up. Une promesse qui n’a pas été tenue. “Il devenait de plus en plus difficile de mener nos recherches”, assure ainsi Jan Leike, le deuxième patron de l’équipe, lui aussi démissionnaire. Et d’affirmer que “la sécurité a été reléguée au second plan au profit de nouveaux produits”.
“Non-dénigrement” – Au moins trois autres responsables de la sécurité ont quitté l’entreprise. Face à cette vague de départs, Sam Altman a promis d’en faire plus dans le domaine. Un double discours qui rappelle celui sur la régulation. Dans sa quête vers une IA générale, capable d’apprendre et de réaliser n’importe quelle tâche, le patron d’OpenAI ne semble plus vouloir s’embarrasser des discours contestataires. Une volonté également illustrée par les informations du site Vox, qui a révélé que la société a fait signer des clauses de “non-dénigrement” à ses anciens employés, leur interdisant toute critique sous peine de perdre ou de ne pas pouvoir revendre les actions gratuites qui faisaient partie de leur rémunération. Une pratique inhabituelle que Sam Altman assure avoir juste découverte et annulée immédiatement.
Voix imitée ? – Autre polémique: la voix utilisée dans la présentation de GPT-4o. L’actrice Scarlett Johansson estime qu’elle est “étrangement similaire” à la sienne. Elle menace désormais d’attaquer la start-up en justice, indiquant qu’elle avait refusé de prêter sa voix pour faire parler le modèle. OpenAI dément avoir tenté de l’imiter, assurant avoir embauché une actrice plusieurs mois avant d’avoir contactée la star. Un argument mis à mal par le message “her” posté par Sam Altman, en référence au film du même nom dans lequel Scarlett Johansson incarne une IA. Les précédents de la start-up ne plaident pas en sa faveur. Elle aurait utilisé deux bases de données, depuis effacées, contenant des centaines de milliers de livres pour entraîner son modèle GPT. Ou encore des vidéos YouTube pour son outil de création de vidéos Sora.
Pour aller plus loin:
– OpenAI abandonne le développement de son dernier modèle de langage
– Le double discours d’OpenAI sur la régulation de l’IA
Face à OpenAI, les groupes de presse font face à un dilemme
250 millions de dollars sur cinq ans. C’est l’énorme chèque qu’a accepté de signer OpenAI à News Corp, le conglomérat de médias du milliardaire Rupert Murdoch. En échange, le concepteur de ChatGPT va pouvoir utiliser les contenus du Wall Street Journal, du New York Post ou encore du Times pour entraîner ses modèles d’intelligence artificielle générative. Ce partenariat n’est pas le premier. Depuis le début de l’année, la start-up multiplie en effet les accords avec les médias aux États-Unis et en Europe. La liste inclût l’agence Associated Press, Le Monde, le Financial Times ou encore le groupe de presse allemand Axel Springer (Bild, Die Welt, Politico…). Mais c’est la première fois que le montant qu’elle dépense – dont une partie devrait être apportée en crédits d’utilisation de ses services d’IA – fuite dans la presse.
Plusieurs plaintes – Ces partenariats s’inscrivent dans une nouvelle stratégie mise en place par OpenAI. Jusqu’en 2020, la société expliquait s’alimenter auprès de Wikipedia et de deux bibliothèques de livres, simplement appelées Books1 et Books2, qui contenaient selon des chercheurs plusieurs centaines de milliers d’ouvrages piratés. Cette méthode est au cœur de plusieurs procédures judiciaires lancées par des auteurs. OpenAI est aussi poursuivi par le New York Times. Le grand quotidien new-yorkais l’accuse, exemples à l’appui, d’avoir utilisé, sans aucune autorisation ni rémunération, des millions d’articles pour entraîner ses grands modèles de langage. Il lui réclame des “milliards de dollars dommages” et la mise hors ligne des modèles alimentés par ses contenus. Huit quotidiens locaux américains ont suivi la même voie.
Baisse du trafic – Avec ces accords, OpenAI s’achète la paix avec les grands médias – comme l’ont fait Google et Facebook, qui ont multiplié les initiatives, le plus souvent rémunératrices, notamment auprès des grands titres de presse écrite. Sur le plan judiciaire d’abord, en obtenant le droit d’utiliser leurs contenus. Sur le plan médiatique ensuite, limitant les critiques sur l’impact négatif attendu de l’intelligence artificielle générative. L’émergence des chatbots menace en effet de modifier radicalement la manière dont les internautes trouvent des informations, leur permettant d’obtenir la réponse qu’ils cherchent sans jamais avoir à cliquer sur un lien. Le magazine américain The Atlantic prédit ainsi une chute de 75% des visites générées par les moteurs de recherche, qui représentent environ 40% de son trafic.
Résistance futile ? – En s’associant à OpenAI, ces médias pourraient donc alimenter la machine qui va décimer leurs recettes publicitaires. Mais ont-ils vraiment le choix ? “Sans accord, ils utiliseront notre contenu de manière plus ou moins clandestine, sans aucun avantage pour nous”, regrette Louis Dreyfus, le président du directoire du Monde, cité par le Wall Street Journal. Et la start-up peut nouer des partenariats avec d’autres titres. Ces groupes préfèrent donc prendre un chèque plutôt que de mener une résistance qui semble futile. D’autant plus qu’OpenAI leur promet un traitement de faveur: des liens vers leurs articles dans les réponses de ChatGPT – un moyen de réduire la baisse attendue du trafic. Ces accords profitent une nouvelle fois aux grands médias, au détriment des plus petits qui seront, eux, les grands perdants.
Pour aller plus loin:
– Comment OpenAI tente d’éviter de nouvelles poursuites judiciaires
– Pourquoi les procédures judiciaires se multiplient contre OpenAI
Après Google, Reddit signe un accord de licence avec OpenAI
Le partenariat était attendu. Mi-mai, Reddit a annoncé avoir conclu un accord de licence avec OpenAI pour lui permettre d’utiliser les 16 milliards de messages publiés par ses utilisateurs à des fins d’entraînement des modèles d’intelligence artificielle générative. La plateforme de discussions s’était déjà entendue, fin mars, avec Google, pour un montant estimé à près de 200 millions de dollars sur trois ans. Les analystes tablent sur un montant similaire versé par le concepteur de ChatGPT, dont le patron, Sam Altman, détient 8% du capital de… Reddit. La société, dont le modèle économique repose pour le moment presque intégralement sur la publicité, espère que l’IA représentera un nouveau relais de croissance qui lui permettra de devenir rentable. Cependant, la Federal Trade Commission, le gendarme américain de la concurrence, a lancé une enquête sur ces accords de licence, faisant peser une incertitude sur leur avenir.
Pour aller plus loin:
– Pour ses débuts boursiers, Reddit surfe sur l’engouement autour de l’IA
– Après l’euphorie, les craintes d’une bulle autour de l’IA générative
Crédit photos: OpenAI - Unsplash / Rolf van Root