Google affole le marché des puces mémoire
Et aussi: Meta teste des abonnements payants
L’innovation de Google qui affole (à tort ?) le marché des puces mémoire
Rarement la publication d’un article de recherche aura eu un tel impact en Bourse. Depuis une semaine, les géants des puces mémoire voient leur cours décrocher, effaçant une partie des gains spectaculaires accumulés depuis un an. En cause: une nouvelle technologie dévoilée par des chercheurs de Google, qui laisse entrevoir une réduction significative des besoins en mémoire pour faire fonctionner des modèles d’intelligence artificielle générative. Cette avancée pourrait permettre d’abaisser les coûts d’inférence, tout en pesant sur la demande pour certaines puces.
L’impact sur les fabricants de mémoire est difficile à déterminer. D’abord, parce que la technologie reste au stade de la recherche, sans garantie d’applications à grande échelle ni de visibilité sur les bénéfices réels. Ensuite, parce que les gains pourraient être compensés par un bond des usages, favorisé par la diminution des coûts de l’IA. Sans compter que la demande pour ces puces demeure largement supérieure à l’offre. La réaction des marchés illustre néanmoins une ambivalence persistante, entre perspectives commerciales considérables et craintes d’une possible bulle.
Six fois moins de mémoire
L’essor de l’IA générative ne repose pas seulement sur une puissance de calcul colossale, fournie par des cartes graphiques. Il s’appuie également sur d’énormes quantités de mémoire, apportées par différents types de puces, en particulier les mémoires HBM, indispensables pour l’entraînement des modèles. Cet appétit massif a provoqué une crise de sous-production, entraînant une réallocation des capacités vers les composants dédiés à l’IA et une flambée des prix. Les répercussions dépassent largement le secteur, touchant aussi les puces utilisées dans les smartphones et les PC.
Concrètement, l’innovation des équipes de Google intervient lors de la phase d’inférence, c’est-à-dire le processus de génération d’un texte ou d’une image. Elle prend la forme d’un algorithme de compression des modèles d’IA, capable de réduire drastiquement la mémoire nécessaire “sans aucune perte de précision”. Dans les tests menés sur plusieurs modèles open source, une division par six a été obtenue. “Sa mise en œuvre est exceptionnellement efficace et entraîne une surcharge d’exécution (donc des surcoûts, ndlr) négligeable”, assurent par ailleurs les chercheurs.
Réaction disproportionnée ?
Ces gains d’efficacité ne concernent toutefois pas l’ensemble du processus. Même si les résultats des tests se confirmaient en conditions réelles, ils ne se traduiraient donc pas par une division par six des besoins globaux en mémoire. La méthode de compression mise au point par Google pourrait néanmoins entraîner une baisse significative des coûts d’inférence – une avancée potentiellement cruciale, alors que le développement des agents d’IA devrait décupler les usages. Elle pourrait aussi permettre l’exécution de modèles en local, sans avoir à supporter les coûts d’une plateforme cloud.
Les analystes jugent cependant que les inquiétudes des marchés sur la demande en mémoire sont disproportionnées. Trois arguments sont avancés. D’une part, les puces HBM, les plus lucratives, ne devraient pas être affectées. D’autre part, les gains d’efficacité permettraient de faire fonctionner davantage de modèles à quantité de mémoire constante, plutôt que de réduire les volumes nécessaires pour un usage équivalent. Enfin, la baisse des coûts de l’inférence pourrait encore accélérer le déploiement de l’IA – un phénomène connu sous le nom de paradoxe de Jevons.
Pour aller plus loin:
– Nvidia opère un virage stratégique avec sa première puce dédiée à l’inférence
– L’IA fait bondir les profits de Samsung et SK Hynix
PARTENAIRE
“Le principal frein à l’IA, ce n’est pas le risque, c’est la compréhension”
Trois ans après ChatGPT, où en sont vraiment les entreprises dans leur adoption de l’IA ?
Daoud Chami, AI Domain Leader chez CBTW – Le niveau de maturité reste très disparate. D’un côté, des early adopters qui ont déployé des solutions d’IA en interne. De l’autre, un nombre encore significatif d’acteurs se pose encore la question fondamentale: concrètement, à quoi cela peut-il me servir ? Une part importante de notre travail chez CBTW consiste encore à accompagner les entreprises dans l’identification de cas d’usage pertinents.
Qu’est-ce qui bloque concrètement ?
Le principal frein reste une compréhension encore partielle de ce qu’est réellement l’IA en entreprise. Dès que l’on sort des outils de bureautique accessibles à tous, les entreprises ont du mal à se projeter sur une IA intégrée, connectée à leur système d’information et couplée à du code. Elles ne savent pas toujours ce que la technologie peut faire pour elles, ni combien cela peut coûter. La question du risque existe, bien sûr, mais elle reste secondaire dans les faits.
L’IA agentique est présentée comme la prochaine étape. Les entreprises en comprennent-elles le potentiel ?
Pas encore totalement. Pour beaucoup, l’IA agentique reste une notion assez abstraite, notamment lorsqu’il s’agit de l’appliquer à des process métiers complexes. En réalité, un agent IA est un système capable d’exécuter des tâches en interagissant avec différents outils (CRM, ERP, bases de données…) selon des règles définies. Il ne “réfléchit” pas au sens humain du terme : il applique des instructions et automatise des processus. Et c’est précisément ce qui fait sa force.
Le vrai défi, c’est de faire collaborer les agents entre eux ou avec les humains ?
L’interface humain-agent est beaucoup plus complexe que l’interface agent-agent. Deux agents qui collaborent, c’est techniquement simple: l’un est un outil pour l’autre. En revanche, les humains ont tendance à attribuer des capacités illimitées à l’agent qu’ils ont en face d’eux. Ils oublient qu’il est limité à des outils très précis. Notre travail consiste aussi à bien accompagner cette calibration des attentes.
Ne risque-t-on pas de se retrouver avec une prolifération d’agents ingouvernables ?
Le risque est réel. Nous le voyons déjà chez certains clients. Ils ont parfois des dizaines d’agents en fonctionnement, chacun dédié à une tâche spécifique. Et avec le temps, une forme de “legacy” s’installe. Certains sont mal nommés, d’autres sont mal documentés, ou simplement oubliés.
Tant que ces agents restent isolés, ce n’est pas forcément problématique. Mais la situation se complique avec les architectures multi-agents, où les interactions se multiplient. Un agent peut en appeler un autre, lui-même connecté à différentes briques du système d’information. Dans ce contexte, la capacité à cartographier et piloter ces interactions devient un enjeu clé.
Une entreprise peut-elle vraiment se lancer seule dans un projet d’IA agentique ?
En théorie, ce n’est pas impossible. Mais en pratique, c’est extrêmement complexe de bien faire sans accompagnement. La première difficulté réside dans le choix des cas d’usage. Sans expertise, il est facile de mal prioriser, de surestimer les gains ou de sous-estimer les coûts. Ensuite, la véritable création de valeur ne vient pas des outils d’IA “clé en main”, mais de leur intégration dans le système d’information. Cela demande des compétences très pointues.
Réussir un projet de bout en bout implique de maîtriser toutes les étapes, du cadrage à la mise en production. Ce n’est pas impossible seul, mais le risque est alors élevé de rejoindre la longue liste des projets qui ne dépassent jamais le stade du prototype.
Quels cas d’usage IA prioriser pour générer un ROI mesurable ?
📘 Téléchargez les 5 cas concrets pour identifier et déployer l’IA agentique là où elle génère le plus de valeur
💬 Échangez avec les experts chez CBTW pour identifier les cas d’usage agentiques les plus impactants dans votre entreprise
Pourquoi Meta franchit le pas des abonnements payants
En franchissant l’an dernier la barre des 200 milliards de dollars de chiffre d’affaires annuel – en hausse de 24 % sur un an –, Meta a une nouvelle fois démontré que sa machine publicitaire demeurait une incroyable machine à cash. Pourtant, la maison mère de Facebook, Instagram et WhatsApp explore un nouveau relais de croissance: les abonnements. Depuis lundi, une nouvelle offre payante est testée dans trois pays sur sa plateforme de photos et de vidéos. D’autres expérimentations sont d’ores et déjà prévues pour ses deux autres applications phares.
Baptisé Instagram Plus, l’abonnement donne accès à des fonctionnalités supplémentaires autour des Stories, ces photos et vidéos éphémères qui disparaissent au bout de 24 heures. Les abonnés peuvent notamment consulter une story sans en notifier l’auteur, prolonger la visibilité de leurs publications d’une journée, envoyer des “superlike” ou encore créer un nombre illimité de listes d’audience. Selon des captures d’écran diffusées en ligne, l’offre est actuellement testée au Japon, au Mexique et aux Philippines. Son tarif varie entre un et deux euros par mois.
Offre sans publicité
Le groupe dirigé par Mark Zuckerberg propose déjà deux types d’abonnement, mais leur logique est différente – et leur potentiel commercial bien plus limité. L’offre Meta Verified s’adresse aux créateurs de contenus et aux entreprises. Commercialisée à partir de 14 euros par mois, elle permet d’obtenir le fameux badge bleu de certification, ainsi qu’une assistance 24 heures sur 24 et une meilleure protection contre les usurpations d’identité. Une déclinaison “Business Max” est même proposée à près de 400 euros par mois.
Meta propose aussi des abonnements permettant de surfer sur Facebook et Instagram sans aucune publicité. Ceux-ci sont réservés à l’Union européenne et au Royaume-Uni, leur existence étant directement liée aux contraintes réglementaires. Ces offres reposent sur le principe de “pay or consent”: refuser de payer revient à consentir à l’utilisation de ses données personnelles à des fins publicitaires. Une interprétation vivement contestée, qui a contraint le groupe à introduire une troisième option: des annonces “moins personnalisées”, fondées sur l’activité des deux dernières heures.
Bientôt des offres d’IA ?
Avec ce nouvel abonnement, Meta s’inscrit dans la lignée du modèle freemium initié par Twitter dès 2021, dont l’offre payante, initialement baptisée Blue, a été renommée X Premium suite au rachat du réseau social par Elon Musk. L’année suivante, Snapchat a lancé Snapchat+, qui a franchi en février le cap des 25 millions de clients, générant ainsi plus d’un milliard de dollars de revenus annuels. Fort de près de 3,6 milliards d’utilisateurs quotidiens sur l’ensemble de ses applications, Meta peut raisonnablement espérer en convertir plusieurs dizaines de millions en abonnés payants.
L’impact sur le chiffre d’affaires restera toutefois modeste au regard de la puissance de sa machine publicitaire. Mais ces revenus pourraient apporter quelques points de croissance additionnels, bienvenus pour rassurer Wall Street, alors que les dépenses liées à l’intelligence artificielle atteignent des niveaux records. Surtout, ces abonnements pourraient ouvrir la voie à des offres centrées sur des outils d’IA, comme les agents issus du rachat de la start-up chinoise Manus. Un début de monétisation indispensable pour rentabiliser les investissements colossaux engagés par Meta.
Pour aller plus loin:
– Malgré des milliards investis dans l’IA, Meta navigue toujours à vue
– Meta et YouTube reconnus coupables d’avoir rendu leurs plateformes addictives
Crédit photos: SK Hynix – Unslapsh / Brett Jordan





