Chercher le modèle
Un soupir lui échappe
Voilà. Hier en fin de journée, l’administration Trump vient d’autoriser le retour de Mythos 5, le fameux modèle d’Anthropic qui tue-tout-trop-dangereux-pour-le-mettre-entre-toutes-les-mains, après le psychodrame d’il y a 15 jours et son interdiction à l’export, ainsi que celle de son rejeton Fable 5. Ce retour est bien encadré et seules des organisations validées par le gouvernement américain y ont accès. Quant à Fable 5, lui, il manque à l’appel, restant toujours sous “embargo”.
Quasiment au même moment, OpenAI annonce la sortie d’une version preview de GPT-5.6… sous les mêmes restrictions imposées par le même gouvernement américain. Comme son pote Mythos 5, la preview de GPT-5.6 est pour le moment réservée à des organisations validées de la même manière pas les mêmes personnes.
Décidément, toutes ces technologies et tous ces modèles sont vraiment trop dangereux pour qu’on les laisse dans les mains des enfants gâtés de la Silicon Valley biberonnés à la science fiction des années 70 et 80… Non ?!?
Bienvenue sur IA-Pulse Weekend. Cette édition porte le numéro 168. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.
⏱️Temps de lecture de cette newsletter par une unité carbone : 8 mins
Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude Opus 4.8 pour les résumés des sources, ainsi que la génération des clusters et des titres. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu de GPT-5.5 Instant . L’image d’illustration ci-dessous a été générée par Midjourney
📰 Les 3 infos de la semaine
🚓 Anthropic accuse Alibaba
Définition de distillation : comment fabriquer un modèle frontière sans payer la R&D. C’est un peu comme quand on fabrique un LLM en exploitant la propriété intellectuelle des autres.
Anthropic accuse Alibaba d’avoir mené la plus vaste opération connue d’extraction de son modèle Claude. Dans une lettre datée du 10 juin et adressée aux sénateurs Tim Scott et Elizabeth Warren, l’entreprise affirme que le groupe chinois et son laboratoire d’IA Qwen ont créé près de 25 000 comptes frauduleux pour générer environ 28,8 millions d’échanges avec Claude, entre le 22 avril et le 5 juin. Le modèle n’est pourtant pas accessible depuis la Chine.
La campagne aurait visé les capacités les plus avancées de Claude — raisonnement agentique, ingénierie logicielle et tâches longues — en s’appuyant sur des techniques d’obfuscation et des réseaux de proxys. La méthode, dite de distillation, consiste à entraîner un modèle moins puissant à partir des sorties d’un modèle plus performant. Anthropic situe l’opération après le mémorandum d’avril par lequel l’administration Trump entendait contrer ces pratiques, et après une première série d’accusations en février visant DeepSeek, Moonshot et MiniMax.
L’entreprise demande au Congrès de durcir le contrôle des exportations de puces et de sanctionner les laboratoires concernés. Alibaba, coté à New York, n’a pas commenté ; son action a reculé en Bourse. Les analystes anticipent un impact réputationnel limité.
Pourquoi est-ce important ? Ce qui est marrant, c’est qu’on peut se demander où en serait Anthropic, et les autres, s’ils n’avaient pas puisé alégrement dans tous les contenus du web et exploiter le travail de millions d’humains sans demander une seule autorisation ni payer un seul dollar. Ils ont distillé tout ce que nous avons posté depuis des dizaines d’années. Et maintenant ils en revendiquent un droit de propriété intellectuelle. Hahaha. “Tes données sont mes données, mes données sont mes données”. C’est beau.
Pour aller plus loin : WSJ, Ars Technica
👔 Claude Tag : Anthropic met un collègue IA dans votre Slack. Facturé au token
Anthropic a lancé Claude Tag, un service qui installe son modèle dans Slack comme un membre permanent de l’équipe. Disponible en bêta pour les clients Enterprise et Team, il remplace l’application Claude in Slack existante. Chaque utilisateur d’un canal peut lui déléguer une tâche en mentionnant @Claude : l’assistant la décompose en étapes, l’exécute avec les outils auxquels il a accès et répond dans un fil de discussion. Le produit repose sur le modèle Opus 4.8.
Quatre caractéristiques le distinguent des intégrations précédentes. Il est partagé : un seul Claude répond à tout le canal, et chacun peut reprendre le travail là où il a été laissé. Il accumule du contexte au fil des échanges, sans qu’il faille réexpliquer les projets. Il prend l’initiative, via un mode ambiant qui signale des informations utiles et relance les sujets restés sans suite. Enfin, il travaille de façon asynchrone, sur plusieurs heures ou jours.
Les administrateurs définissent les outils, les canaux et les données accessibles, fixent des plafonds de dépense et consultent un journal complet des actions. Anthropic indique que 65 % du code de son équipe produit passe désormais par un outil interne équivalent. Le service entre sur un terrain disputé par Salesforce, OpenAI, Microsoft et Perplexity.
Pourquoi est-ce important ? Il faut s’installer là où les utilisateurs sont. Et Anthropic a sur ce sujet une longueur d’avance sur une grande partie de l’industrie. Anthropic est une entreprise fascinante.
Pour aller plus loin : TechCrunch, VentureBeat, Anthropic
🤖 Chez les géants de l'IA, l'humain devient relecteur de l'agent
OpenAI, Google et Anthropic font travailler leurs salariés avec des agents IA, là où beaucoup d’entreprises peinent encore à adopter de simples chatbots. Ces agents ne se contentent pas de transcrire une réunion ou de rédiger un mémo : ils enchaînent des tâches en plusieurs étapes, sur plusieurs applications. L’humain, lui, devient relecteur et vérifie le résultat. Le pari reste risqué : déléguer à un agent a parfois entraîné des suppressions d’e-mails ou du code disparu.
Chez OpenAI, l’outil Codex est utilisé chaque semaine par presque tous les employés, y compris dans le marketing et le recrutement. Un commercial s’en sert pour traiter un litige de facturation, suivre ses indicateurs ou préparer des démonstrations. Une juriste lui confie le travail d’un junior -puis embauche un junior pour relire ce qu’il produit… si si…
Chez Google, un agent compare les factures aux contrats. L’équipe traite cinq fois plus de factures et vise 200 millions de dollars d’économies par an. Les salariés concernés passent désormais à des contrôles de plus haut niveau. Un autre agent propose des placements de trésorerie, qu’une équipe valide avant qu’un troisième n’exécute la transaction.
Chez Anthropic, une responsable marketing fait travailler un agent « constructeur » et un agent « auditeur », puis relit l’ensemble. Sa principale difficulté au début a été d’apprendre à donner les bonnes instructions.
Selon Gartner, une grande entreprise fera tourner plus de 150 000 agents d’ici deux ans. Pourtant, seules 13 % des entreprises pensent avoir une gouvernance suffisante pour les encadrer.
Pourquoi est-ce important ? Vous voulez savoir à quoi ressemble le futur du travail ? Regardez chez ceux qui le vendent.
Pour aller plus loin : WSJ
🚀 5 lectures en plus
What we learned from 1,604 Chinese AI job postings (Epoch AI)
LLMs help robots understand vague instructions and focus on key details (MIT News)
OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom (VentureBeat)
AI Is Learning to Read the Room : Tech that senses human emotions is becoming aware of context (IEEE Spectrum)
🚨 Commemorating 70 Years of Artificial Intelligence (IEEE Spectrum)
🛠️ Des outils, des tutos et des modèles à tester
🚨Control an Android Phone with Gemini 3.5 Flash Computer Use
Mistral OCR 4 - Mistral launches OCR 4, turning document extraction into a full enterprise AI play
🧠 L’article qui fait réfléchir - et qu’il faut absolument lire
The Problem is Prompt Debt
“D'une bande magnétique”
Les interfaces en langage naturel ont changé la manière de développer des applications d’IA. En quelques lignes d’instructions, un modèle de pointe produit un prototype fonctionnel en quelques minutes ou quelques heures. Pour des usages ponctuels, cette approche est remarquablement efficace. Mais dès qu’il s’agit de construire un produit appelé à évoluer, le prompt devient progressivement une dette technique.
Le problème n’est pas un mauvais prompt. C’est le fait d’utiliser le langage naturel, un médium conçu pour l’ambiguïté, la nuance, la résonance, comme un langage de spécification. Alors qu’il n’a jamais été pensé pour décrire précisément le comportement d’un système. Chaque anomalie signalée entraîne l’ajout d’une nouvelle consigne. Les règles s’accumulent, s’entrechoquent, parfois s’annulent. Le prompt enfle, devient inintelligible. Et là, les développeurs commencent à crier en majuscules au modèle. Le prompt ralentit les évolutions et finit par immobiliser les équipes.
Cette fragilité est inhérente aux modèles de langage : ils n’exécutent pas un programme déterministe, ils interprètent un ensemble d’indices probabilistes. Un changement de formulation ou même une phrase apparemment sans lien, suffit à faire basculer le résultat. Les corrections s’interagissent de manière imprévisible. Résoudre un bug aujourd’hui en crée un autre demain.
Pire : les ajustements sont propres à un modèle. Un prompt optimisé pour GPT-4o s’effondre sur la génération suivante. Les organisations ne peuvent donc pas migrer vers des modèles plus performants ou moins coûteux sans tout reconstruire. Elles savent. Elles restent verrouillées quand même.
La sortie existe : faire du prompt un composant du système, pas son fondement. Le comportement attendu se définit par des tests, des métriques, des évaluations objectives. Le prompt devient une variable qu’on génère, mesure et optimise algorithmiquement. Cesse d’être un texte qu’on retouche indéfiniment. Devient ce qu’il aurait toujours dû être : un sous-produit.
📻 Le podcast de la semaine
Robot humanoïde : l’employé du moi
Le retour médiatique des robots humanoïdes tient moins à leur utilité industrielle qu’à l’intégration de l’IA, qui améliore perception, simulation et interaction. Mais leur intérêt reste incertain : bras robotiques souvent plus efficaces, empathie humaine fragile, risque persistant de vallée de l’étrange.
Loop Engineering
Au cœur des discussions autour du “Recursive self-improvement”, un concept a déboulé et envahi le microcosme de l’IA en quelques jours. Ce concept c’est celui du “Loop Engineering” : une manière de faire faire du code pour les machines par les machines
N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai
Partagez cette newsletter
Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !
“Réveil tragique succède
A un sommeil sans rêve”




