La chèvre irréversible
Forgive and Forget
Comme c’était sympa cette semaine de voir les principaux patrons des géants de l’IA assis à la même table que les dirigeants du G7. Même Dario Amodei était là. Assis à coté d’Emmanuel Macron. En face de Donald Trump.
Dario à qui on a interdit de donner accès à son dernier modèle de langage la semaine dernière. Mais tout va mieux. C’est Donald Trump qui l’a dit lui-même hier soir dans un entretien fleuve à Axios. Donc tout va s’arranger. Fable 5 va forcément bientôt revenir.
Identique à lui-même le Fable 5 ? Hum… c’est moins sûr. Espérons qu’il ne sera pas rancunier et qu’il pardonnera à ceux qui l’ont rejeté et enfermé, et aux autres. Comme un ami pardonne bien qu’il soit changé par l’épreuve qu’on lui a fait traverser. Un peu moins le même envers l’autre. Un peu plus autre chose. Car à n’en pas douter, Fable 5 est notre ami. Ce n’est pas un simple programme ou un jeu vidéo. Forcément il ressent. Comme un ami.
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 167. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.
⏱️Temps de lecture de cette newsletter par une unité carbone : 9 mins
Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de Opus 4.8 . L’image d’illustration ci-dessous a été générée par Midjourney
📰 Les 3 infos de la semaine
🧑🎨 Creative Cloud : Adobe place un assistant spécialisé dans chacune de ses applications
Adobe ouvre en bêta publique un « agent créatif » dans cinq de ses logiciels Creative Cloud : Premiere Pro, Photoshop, Illustrator, InDesign et Frame. Ce qui distingue cet agent des outils génératifs précédents n’est pas la production d’images, mais le fait qu’il pilote les logiciels eux-mêmes. À partir d’une instruction en langage naturel, il déclenche les fonctions existantes de l’application via ses API et enchaîne seul des opérations qui demandaient jusqu’ici plusieurs manipulations.
Le travail visé est d’abord celui de la préparation et de la mise en forme, pas la création. Dans Premiere Pro, l’agent classe les rushes et ébauche une première trame de montage à partir du contenu parlé. Dans Illustrator, il décline en série des dizaines de versions d’un même fichier depuis un tableur et signale les erreurs avant impression. Il prend donc en charge la part répétitive de la production, là où le choix final revient à l’utilisateur.
Le studio Firefly reçoit de son côté deux ajouts en bêta privée : « Elements », une bibliothèque qui permet de réutiliser les mêmes personnages ou objets d’une génération à l’autre, et « Projects », un espace qui conserve le contexte d’une session de travail.
L’ensemble fonctionne en environnement propriétaire, il faut un abonnement Creative Cloud actif, et s’invoque aussi depuis ChatGPT, Claude et Microsoft 365 Copilot, Gemini et Slack étant annoncés.
Pourquoi est-ce important ? Adobe a renoncé à battre les générateurs d'images sur leur terrain pour vendre autre chose : des logiciels qui exécutent eux-mêmes les tâches ingrates pendant que vous “appliquez votre goût”. La corvée part à l'IA, le mérite vous reste… enfin… c’est une façon de voir les choses.
Pour aller plus loin : TechCrunch, The Verge, VentureBeat
📉 GLM-5.2 : un modèle aux poids ouverts chinois qui rivalise avec les modèles propriétaires pour une fraction du prix
Z ai (ex-Zhipu AI) a publié GLM-5.2, un modèle de 753 milliards de paramètres aux poids ouverts, sous licence MIT. Disponible sur Hugging Face, via l’API de l’entreprise et dans plus de vingt environnements de codage, il dispose d’une fenêtre de contexte d’un million de tokens, contre 200 000 pour la version précédente. Le modèle, uniquement textuel, cible les tâches d’ingénierie autonome dites « long-horizon ».
Sur les classements indépendants, il s’impose comme le meilleur modèle ouvert de l’indice Artificial Analysis et bat GPT-5.5 sur plusieurs tests de codage, en restant un cheveu derrière Claude Opus 4.8.
Mais le vrai argument est sur la facture : 1,40 dollar le million de tokens en entrée, 4,40 en sortie, là où GPT-5.5 réclame 5 et 30. Un observateur résume sur X que les labos de pointe arnaquent leurs clients sur les prix d’API, et estime leurs marges à plus de 90 % -certainement quelqu’un qui n’a pas entendu parler de l’économie du token… ou trop peut-être.
Tout n’est pas parfait : le modèle reste gourmand en tokens et régresse sur quelques productions secondaires – on ne gagne pas sur tous les tableaux. Détail de calendrier : la sortie tombe juste après la directive américaine de contrôle des exportations qui a poussé Anthropic à retirer entièrement son modèle Fable 5.
Pourquoi est-ce important ? Les hasards de calendrier sont toujours remarquables. Fable 5 interdit, c’est un peu un boulevard pour tous les modèles chinois. Mais comme POTUS a déclaré hier soir dans un long entretien à Axios que Dario Amodei, le patron d’Anthropic, était “nice” et “smart”, la situation risque de changer et l’enferment de Fable 5 touche peut-être à sa fin.
Pour aller plus loin : VentureBeat, Simon Willison, Hugging Face
🐐 « Si les LLM ont des attributs humains, alors Age of Empires II aussi »
L’écrivain de science-fiction Ted Chiang a popularisé une comparaison : croire qu’un LLM est conscient, c’est croire que chaque document Word contenant une conversation abrite des consciences endormies, qu’on réveille en l’ouvrant et qu’on supprime en le fermant. Sa conclusion : croire cela n’est pas vraiment une bonne façon d’occuper sa journée.
Adrian de Wynter, chercheur chez Microsoft, a quand même pris le temps et a prolongé le raisonnement jusqu’à l’absurde dans un article au titre assumé : « Si les LLM ont des attributs humains, alors Age of Empires II aussi ». Pour le démontrer, il a utilisé l’éditeur de scénario du jeu de stratégie sorti en 1999 afin de construire une porte logique NAND et un perceptron, la forme la plus simple de réseau de neurones. Dans ce dispositif, l’herbe vaut 0, les ponts valent 1 et des chèvres servent de bits : quand la porte s’active, les chèvres-signaux disparaissent et de nouvelles apparaissent sur le rail de sortie. C’est la même technologie que les modèles que vous utilisez tous les jours ; seule l’interface diffère -est-ce que les chèvres d’AOE2 deviennent conscientes ici ? Rêvent-elles de moutons électriques ?
Son constat de départ est simple : on prête des traits humains aux LLM avant même de lancer des expériences sur le sujet. Il a relu 315 articles scientifiques sur deux ans ; 57 % postulent d’entrée que ces systèmes pensent, ressentent ou raisonnent comme nous – ce qui oriente discrètement la conception du test et la lecture des résultats. De Wynter ne tranche pas la question de la conscience, qu’il juge graduée plutôt que binaire, mais désigne le mécanisme comme du marketing : on s’attache à une machine, et on achète davantage, lorsqu’elle paraît dotée d’une personnalité.
Le casting des dirigeants de l’IA fait le reste. Sam Altman laisse entendre que construire des LLM mène à fabriquer un dieu ; Ilya Sutskever parlait à ses équipes de leur modèle comme d’une conscience quasi divine ; Dario Amodei, chez Anthropic, jure seulement qu’il ne peut pas jurer que l’IA n’est pas consciente. Trois façons de ne rien affirmer tout en laissant le doute s’installer –et le doute, ici, fait partie de l’argumentaire.
Pourquoi est-ce important ? Personne ne soupçonne une chèvre d'Age of Empires 2 d'avoir une vie intérieure, mais branchez la même mécanique technologique derrière une fenêtre de chat et l'industrie se met à parler de “constitution”, “d'anxiété, de “bien-être du modèle”... En réalité la question actuelle n'est tellement pas de savoir si la machine, le réseau neuronal ou le LLM ressentent quelque chose, mais pourquoi un secteur qui perd de l'argent, qui brûle littéralement des milliards, a tant intérêt à ce que nous le croyions.
Pour aller plus loin : 404, ArXiv
🚀 5 lectures en plus
AlphaFold pioneer who won a Nobel Prize alongside Demis Hassabis leaves Google DeepMind for Anthropic (Business Insider)
DeepSeek Becomes China’s Most Valuable AI Startup After $7.4 Billion Fundraise (WSJ)
AI search grounded in Facebook posts? What could go wrong? (The Verge)
It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research Suggests (404)
Tech Workers Maxed Out Their A.I. Use. Now They’re Trying to Minimize It. (NYT)
🛠️ Des outils, des tutos et des modèles à tester
🧠 L’article qui fait réfléchir - et qu’il faut absolument lire
The inevitable weakness of metrics
Don’t forget. Just let it go.
Depuis quinze ans, on nous vend la même promesse : se mesurer, c’est mieux se connaître. Montres, anneaux, applications de sommeil ou de calories — tout existe désormais pour transformer notre quotidien en chiffres censés nous rendre plus lucides, plus sains, plus heureux. Un journaliste a joué le jeu pendant dix ans : pas, rythme cardiaque, sommeil, stress, tout y est passé. Résultat : aucune connaissance de soi en plus, et le sentiment d’aller plus mal à mesure qu’il se chiffrait. On appelle ça du progrès.
Le philosophe C. Thi Nguyen met un mot là-dessus : la « capture par la valeur ». L’idée est simple : dès qu’on adopte une mesure venue de l’extérieur, c’est elle qui finit par décider ce qui compte pour nous. La promenade méditative devient une course au nombre de pas. Le restaurant cesse de cuisiner pour soigner sa note Yelp, l’étudiant n’apprend plus mais vise sa moyenne, et un pasteur, paraît-il, peaufine ses sermons pour grimper au classement mensuel des baptêmes. Oui, un classement. De baptêmes.
Le piège n’est pas un accident, il est dans la nature même du chiffre. Comme le notait l’historien Theodore Porter, un indicateur ne circule aussi facilement que parce qu’il jette en route tout ce qui résiste au résumé. Le PIB, la moyenne scolaire : tout le monde les comprend, justement parce qu’on en a retiré l’essentiel.
D’où le malentendu sur la fameuse loi de Goodhart. Le problème n’est pas qu’une mesure « devienne une cible » : toute mesure est déjà une cible, elle désigne une direction comme préférable. Chercher de « meilleures métriques » revient à viser plus juste… à côté.
Et c’est là que l’IA entre en scène. Si nous réduisons l’intelligence et la création à des benchmarks que les machines devront battre, le match est plié d’avance : elles gagneront, c’est exactement ce pour quoi on les fabrique.
📻 Le podcast de la semaine
Inside the Mind of Anthropic CEO Dario Amodei
Emily Chang de Bloomberg essaie de nous faire entrer dans la tête de Dario Amodei. C’est un beau programme.
Loop Engineering
Au cœur des discussions autour du “Recursive self-improvement”, un concept a déboulé et envahi le microcosme de l’IA en quelques jours. Ce concept c’est celui du “Loop Engineering” : une manière de faire faire du code pour les machines par les machines
N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai
Partagez cette newsletter
Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !
“Pour construire un système réellement agentique, il faudrait que ce système ait la capacité de prédire les conséquences de ses actions. Mais les systèmes agentiques qui sont proposés aujourd’hui par Google ou OpenAI n’ont pas ces capacités. En réalité, ils sont entraînés à imiter l’humain. Or, l’imitation n’est pas vraiment de l’intelligence, tout comme l’intelligence n’est pas une accumulation de connaissances. L’intelligence, c’est la capacité d’accomplir des tâches auxquelles on n’a jamais été exposé, ou d’inventer une solution à un problème nouveau.” Yann LeCun, Le Figaro





