Amazon mise sur l'IA générative pour relancer son assistant Alexa
Dix ans après son lancement, Alexa rêve d’une seconde jeunesse. La semaine dernière, Amazon a dévoilé une version survitaminée de son assistant vocal, dopée à l’intelligence artificielle générative. “Notre vision a toujours été ambitieuse, mais jusqu’à maintenant nous avons été limités par la technologie”, assure Panos Panay, l’ancien chef des produits de Microsoft, recruté à l’automne 2023 par le géant du commerce en ligne. Baptisé Alexa+, le service profite en effet des progrès spectaculaires réalisés ces dernières années dans le sillage de ChatGPT. Il est désormais capable de discuter en langage naturel. Et de répondre à des requêtes beaucoup plus complexes ou de retenir des informations personnelles. Il peut aussi se connecter à des “dizaines de milliers” de services. Lancé d’abord aux États-Unis, celui-ci sera payant – au moins sur le papier.
Enceintes connectées – Voilà près de quinze ans que le groupe de Seattle travaille sur les assistants vocaux. À l’époque, il cherche la réponse à Siri, tout juste ajouté à l’iPhone d’Apple. Alexa est lancé fin 2014, se distinguant par son activation vocale. Le service est intégré à une nouvelle catégorie de produits, les enceintes connectées Echo. Longtemps seules sur ce marché, celles-ci rencontrent alors un joli succès commercial. Elles profitent de la vitrine du site marchand d’Amazon. Et aussi de leur prix attractif: elles sont vendues à prix coûtant avec l’objectif d’augmenter la base d’utilisateurs pour la monétiser d’une autre manière. La société voit alors très grand. La division chargée du projet compte jusqu’à 10.000 employés. Alexa est aussi mis à toutes les sauces: dans les horloges, les ampoules et même les fours micro-ondes.
Un an de retard – Les assistants vocaux ont cependant rapidement montré leurs limites, faute d’amélioration majeure. Et l’essor de l’IA générative les a complètement ringardisés. En septembre 2023, Amazon avait ainsi promis une version améliorée d’Alexa. Mais ses ingénieurs ont rencontré plus de difficultés que prévu pour atteindre des temps de réponse convenables et réduire les hallucinations. Selon l’agence Bloomberg, le lancement était initialement prévu début 2024. Pour répondre aux requêtes, Alexa+ s’appuie sur plusieurs modèles de langage, en particulier Claude d’Anthropic, la start-up dans laquelle la société a investi huit milliards de dollars. Face à ChatGPT et autres services d’IA, Amazon mise sur les 600 millions d’appareils compatibles avec Alexa déjà vendus. Une application mobile et un site Internet vont aussi être lancés.
Abonnement Prime – En ajoutant de l’IA générative, le groupe espère enfin rentabiliser ses importants investissements. Sur le papier, Alexa+ est proposé à 20 dollars par mois – soit le tarif de ChatGPT Plus. Dans les faits, personne ne devrait payer ce prix: le service est en effet intégré à l’abonnement Prime, commercialisé à 15 dollars par mois ou 139 dollars par an. Mais Amazon peut espérer convaincre des utilisateurs d’Echo de souscrire à son offre. Et ainsi augmenter ses ventes car les clients Prime, qui bénéficient notamment de la livraison gratuite en un ou deux jours, achètent davantage que les autres. Il ne serait par ailleurs pas étonnant que la société utilise Alexa+ pour justifier de prochaines hausses de prix de son abonnement. Autre source potentielle de monétisation: des commissions facturées aux services partenaires.
Pour aller plus loin:
– Après le flop de l’AI Pin, la start-up Humane est rachetée par HP
– Grâce à l’IA, les lunettes connectées deviennent tendance
Malgré le lancement d’un nouveau GPU, les doutes s'accumulent autour de Nvidia
Il y a quelques mois, les résultats financiers de Nvidia auraient probablement été accueillis avec enthousiasme par Wall Street. Au quatrième trimestre, le géant des cartes graphiques a dépassé les attentes, avec un chiffre d’affaires record de 39,3 milliards de dollars, en hausse de 78%, et des profits de 22,1 milliards. Mais une partie des investisseurs doutent désormais que la demande future pour ses puces dédiées à l’intelligence artificielle générative justifie encore une capitalisation boursière de 3.000 milliards de dollars. Car les signaux d’alerte s’accumulent. Le déploiement de l’IA dans les entreprises ne décolle pas. Les restrictions d’exportation de GPU pourraient être renforcées. Et les avancées de DeepSeek semblent démontrer qu’il est possible de concevoir des modèles compétitifs sans une immense puissance de calcul.
Lancement de Blackwell – Nvidia a aussi franchi une étape cruciale: le lancement commercial de son architecture Blackwell. Celle-ci affiche des performances bien supérieures à l’architecture Hopper, sur laquelle est bâti le H100, qui a longtemps été la référence du secteur. Son développement ne s’est pas fait sans difficulté, notamment à cause de problèmes de surchauffe. Entre novembre et janvier, ces nouveaux GPU ont généré 11 milliards de dollars de ventes. “La demande est extraordinaire”, assure Jensen Huang, le patron du groupe de Santa Clara, qui promet une accélération des cadences de production. Non seulement Blackwell lui permet de reprendre ses distances sur la concurrence. Mais c’est aussi le point de départ d’une feuille de route visant à doubler le rythme d’innovation, avec un nouveau modèle par an, au lieu de tous les deux ans.
Paradoxe de Jevons – La croissance folle du chiffre d’affaires pourrait cependant être menacée par les techniques d’entraînement mises au point par la start-up chinoise DeepSeek. S’il est encore trop tôt pour mesurer leur impact précis, celles-ci pourraient provoquer un changement de paradigme sur un secteur habitué à dépenser des sommes folles pour accroître ses capacités de calcul, en achetant des dizaines ou centaines de milliers de GPU vendus à prix d’or. Jensen Huang se montre confiant. Il estime même que cette évolution sera bénéfique pour Nvidia. En abaissant les coûts d’entraînement et d’inférence, elle devrait en effet permettre de faire baisser le prix des fonctionnalités d’IA. Et donc de doper leur adoption, jusque-là limitée par des tarifs élevés. C’est le paradoxe de Jevons, du nom de l’économiste britannique qui l’a mis en lumière.
Nouvelles restrictions – Deux autres incertitudes s’ajoutent à cette inquiétude. D’abord, Donald Trump a annoncé des droits de douane additionnels sur les puces produites hors des États-Unis. Si cette mesure est mise en place, elle s’appliquerait aux GPU de Nvidia gravés à Taïwan par TSMC. Le groupe devra alors augmenter ses prix, pénalisant potentiellement la demande, ou réduire des marges déjà sous pression – bien que toujours très élevées. Ensuite, l’administration Trump souhaite renforcer les restrictions d’exportation vers la Chine, explique l’agence Bloomberg. Cela pourrait concerner les puces H20 du groupe américain, que DeepSeek a pu acheter légalement. Par ailleurs, Washington doit encore se prononcer sur de nouvelles restrictions qui concernent quasiment tous les pays du monde, limitant les débouchés commerciaux de Nvidia.
Pour aller plus loin:
– DeepSeek, symbole d’un échec du modèle américain dans l’IA
– Nvidia dédramatise après les avancées de DeepSeek
Crédit photos: Unsplash / Lazar Gugleta - Nvidia