Le premier échec d'OpenAI
Et aussi: La 5G ne tient pas ses promesses - Anthropic poursuivi par des maisons de disque
OpenAI abandonne le développement de son dernier modèle de langage
Sur le papier, tout semble réussir à OpenAI, propulsé au rang de leader de l’intelligence artificielle générative après le lancement tonitruant de ChatGPT il y a près d’un an, qui lui permet d’enregistrer un bond spectaculaire de son chiffre d’affaires. En coulisses pourtant, la start-up américaine a enregistré au cours de l’été un revers majeur. Selon le site The Information, elle a en effet dû abandonner le développement d’un nouveau grand modèle de langage, devant alimenter son robot conversationnel. Baptisé Arrakis en interne, en référence à la planète désertique du roman Dune, celui-ci devait concrétiser une nouvelle orientation technologique, connue sous le nom de “parcimonie”. Et qui doit permettre de réduire les frais de fonctionnement, un enjeu majeur pour ne pas freiner l’adoption de l’IA générative.
Coûts d’inférence – OpenAI n’a jamais communiqué officiellement sur Arrakis. Les premières rumeurs sont apparues il y a quelques semaines sur le forum Reddit. Son entraînement aurait débuté fin 2022, potentiellement pour remplacer les modèles GPT, actuellement utilisés par ChatGPT. En juin, le patron de la société, Sam Altman, expliquait ainsi travailler sur des “idées nouvelles” avant de lancer le développement d’une nouvelle version de GPT. Avec Arrakis, il espérait réduire les coûts d’inférence, liés à la génération des réponses aux requêtes. Ces dépenses peuvent rapidement grimper à mesure que les services d’IA générative gagnent en popularité. L’outil d’aide à l’écriture de code informatique proposé par la plateforme Github, détenue par Microsoft, génère par exemple 20 dollars de pertes par mois et par abonné.
Parcimonie – Les coûts d’inférence représentent une menace sur le modèle économique des nouveaux outils alimenté par l’IA générative. Et donc un potentiel frein à la croissance d’OpenAI. Pour les réduire, la start-up misait sur le concept de “sparsity” – “parcimonie” en français. L’idée est de remplacer les grands modèles généralistes qui réclament beaucoup de puissance informatique par une panoplie de modèles dédiés à certaines tâches, plus petits et donc moins onéreux à utiliser. Cette approche est également suivie par Google et d’autres acteurs du secteur. Une fois entraîné, Arrakis aurait ainsi dû être capable de déterminer le sous-modèle le plus adapté pour chaque requête, tout en conservant des performances similaires à celles de GPT-4, le dernier grand modèle de langage conçu par OpenAI.
Une aubaine pour Google ? – La start-up américaine n’a cependant pas été satisfaite par les gains d’efficacité, préférant donc passer à autre chose. Elle a ainsi redirigé ses efforts vers une version “turbo” de GPT-4, capable de répondre plus rapidement. OpenAI continue aussi d’ajouter des fonctionnalités à ChatGPT, qui peut désormais reconnaître des images et comprendre des instructions audio. L’échec d’Arrakis n’aura pas d’impact à court terme sur son chiffre d’affaires, qui n’en finit plus de grimper – plus de 100 millions de dollars par mois, selon The Information. En revanche, le groupe comptait probablement sur son nouveau modèle pour réduire ses pertes. Surtout, cet échec pourrait ouvrir une porte à Google, dont le prochain modèle, baptisé Gemini, devrait, lui, intégrer le principe de “parcimonie”.
Pour aller plus loin:
– Les coûts de l’intelligence artificielle menacent de freiner son adoption
– ChatGPT fait perdre plus de 500 millions de dollars à OpenAI
Nokia, symbole des promesses non tenues de la 5G
Après Ericsson en début d’année, c’est au tour de Nokia de mener un important plan social. D’ici à 2026, le géant finlandais des équipements de réseau va supprimer jusqu’à 14.000 postes, soit 16% de ses effectifs. Il espère ainsi réaliser jusqu’à 1,2 milliard d’euros d’économies, dont 400 millions dès l’an prochain. “Face à un environnement de marché plus difficile, nous devons réduire notre base de coûts pour protéger notre rentabilité”, justifie son patron Pekka Lundmark. Au troisième trimestre, le groupe a accusé une chute de 69% de ses profits, pour des recettes en baisse de 20%. Comme son rival suédois, qui prévoit de licencier 8.500 salariés, Nokia est rattrapé par la baisse des investissements dans la 5G, qui ne tient pas toutes ses promesses. À la fois pour les équipementiers, les opérateurs et les clients.
Baisse du marché – Déployée depuis 2019, la 5G devait représenter une immense opportunité pour les équipementiers télécoms. Et encore davantage pour les deux groupes européens, en raison de l’exclusion de Huawei, le leader chinois du secteur, dans de nombreux pays. Après plusieurs années de lourdes dépenses, les opérateurs mobiles commencent cependant à ralentir le rythme. Les dirigeants de Nokia s’attendent ainsi à une baisse de 9% du marché des équipements de réseau cette année, contre un repli jusque-là attendu à seulement 2%. Ils mettent en avant une chute spectaculaire des investissements aux États-Unis, combinée à une hausse moins forte qu’espéré en Inde. La tendance devrait perdurer en 2024, avant une stabilisation espérée l’année suivante, prédit le cabinet Dell’Oro.
Faible intérêt – Ce ralentissement intervient alors que le déploiement du réseau reste faible. Dans son dernier rapport annuel, publié en juin, Ericsson souligne que seulement 10% de la population, hors Chine, habite dans une zone couverte par la “vraie” 5G. Et Nokia estime que seulement un quart des antennes nécessaires ont été installées, hors Chine. Une situation a priori paradoxale mais qui s’explique par le faible intérêt des consommateurs. “Les opérateurs hésitent à investir parce que la monétisation de la 5G a été plus lente que prévu”, reconnaît Pekka Lundmark. Aux États-Unis, 41% des abonnés mobiles disposent d’un forfait compatible. En Europe, seulement 13%. En outre, les opérateurs ont bien du mal à imposer des tarifs plus élevés, comme ils l’espéraient pour justifier leur niveau d’investissement.
Valeur difficilement perceptible – Le principal problème de la 5G vient de sa proposition de valeur. Si les opérateurs ont beaucoup insisté sur le gain de vitesse, celui-ci est difficilement perceptible pour l’immense majorité des usages du grand public. Il s’agit de la principale différence avec la transition vers la 4G, qui avait été bien plus rapide, en particulier en Europe. Pour doper l’adoption de la dernière génération de l’Internet mobile, le secteur mise beaucoup sur l’essor de nouvelles technologies. C’est notamment le cas de la réalité augmentée, dont le potentiel, mis en avant depuis des années, tarde toujours à se concrétiser. Nokia promet aussi de transformer l’industrie avec des réseaux 5G privés, devant offrir plus de sécurité et de fiabilité. Mais, là aussi, le déploiement semble bien plus lent qu’espéré.
Pour aller plus loin:
– Apple prend du retard sur le développement de ses puces 5G
– Bruxelles enterre son projet de la taxe sur les géants d’Internet
Anthropic attaqué en justice par des maisons de disque
Nouvelle plainte contre une start-up spécialisée dans l’intelligence artificielle générative. Cette fois-ci, c’est Anthropic qui est poursuivie par trois maisons de disque, dont Universal Music, le premier acteur du marché. Les plaignants, qui incluent aussi les studios indépendants Concord et ABKCO, lui reprochent d’avoir utilisé des paroles de chansons pour entraîner le grand modèle de langage qui alimente son robot conversationnel Claude. “Ce matériel protégé par le droit d’auteur n’est pas gratuit, simplement parce qu’il peut être trouvé sur Internet”, soulignent-ils. Comme beaucoup d’acteurs du secteur, Anthropic ne communique pas sur les bases de données utilisées pour entraîner son IA. Installée à San Francisco, la start-up a récemment fait entrer Amazon dans son capital, par l’intermédiaire d’un investissement initial de 1,25 milliard de dollars, qui pourra atteindre jusqu’à 4 milliards.
Pour aller plus loin:
– Comment l’intelligence artificielle bouscule l’industrie du disque
– Pourquoi les procédures judiciaires se multiplient contre OpenAI
Crédit photos: Unsplash / Rolf van Root - Unsplash / James Yarema