Bienvenue sur IA Pulse Weekend. Cette édition porte le numéro 80. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter. Gérez votre abonnement.
⏱️Temps de lecture de cette newsletter par une unité carbone : 10 mins
La semaine dernière je ne vous ai pas parlé d’un article de recherche publié par une équipe travaillant pour Apple. Celles et ceux qui suivent l’actualité de l’IA, et aussi et surtout les publications sur les réseaux sociaux de mes confrères commentateurs de l’IA - commentateurs dont je fais partie intégrante, il n’y a rien de péjoratif - ont pu s’apercevoir que cet article faisait grand bruit car, je cite, “il prouve que les LLM ne savent pas raisonner et ne sauront jamais le faire.” Ben en fait, non… Absolument pas. Dire cela, c’est extrapoler.
Cet article ne démontre pas que les LLM ne raisonnent pas. Cet article qui est dans la continuité d’autres recherches - si le sujet vous intéresse je vous invite à lire ou relire L'importance de la distinction entre raisonnement inductif et déductif dans les LLM - va plus loin dans l’étude des capacités des LLM à produire des raisonnements déductifs, en particulier des raisonnements de type logique formelle. Logique formelle que bien entendu, nous tous humains, nous maîtrisons parfaitement pour être justement qualifiés d’humains qui savent raisonner… Vraiment ?
Et même si c’était le cas, le “Raisonnement” ne se limite pas au raisonnement logique, déductif. Damien Beneveniste, qui lui n’est pas un commentateur mais un chercheur, a cette phrase à propos de l’interprétation qui est faite de l’article sur les réseaux sociaux et aussi par certains médias : “Pour une raison quelconque, certaines personnes ont décidé que le raisonnement déductif est le seul type de « vrai raisonnement » et que le reste n’est que « faux raisonnement ».” Et d’ajouter un autre point : “La question n’est pas de savoir si les LLM peuvent raisonner comme les humains. La façon dont les humains le font n’est pas une mesure ni une définition du raisonnement.”
Marc Cavazza, autre chercheur et professeur - qui m’a plusieurs fois tancé, bien à raison - ajoute : “les LLM ne pratiquent pas le raisonnement logique au sens formel, mais les humains non plus, et d'ailleurs les deux montrent un comportement similaire sur la tâche de sélection de Wason [Dasgupta et al., 2023].”
Pour résumer, l’article scientifique en question met en lumière les défauts des LLM actuels dans un type de raisonnement. On ne peut pas en conclure que les LLM ne savent pas, ou ne sauront jamais, “Raisonner”.
Allez je vous laisse avec l’actu de cette semaine avec Adobe, Mistral et Perplexity.
Et puis surtout, écoutez le podcast de la semaine. Il est consacré à l’impact de l’IA dans le travail. Yann Fergurson, encore un chercheur, fait le point sur les recherches du LaborIA. C’est bien plus intéressant qu’un énième rapport d’un “grand cabinet de conseil” sur le sujet.
Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par GPT-4o pour les résumés des articles sources, et Claude-3.5-Sonnet pour la génération du cluster et de son titre. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu d’un ping-pong entre o1-preview et Claude-3.5-Sonnet.
L’image d’illustration ci-dessous est générée par Midjourney.
📰 Les 3 infos de la semaine
🎥Adobe veut démocratiser la création vidéo, sonore et 3D
En début de semaine, Adobe a présenté son modèle Firefly Video, un outil de génération de vidéos à partir de texte. Cette technologie permet de créer des vidéos générées à partir de descriptions écrites, et est similaire aux technologies employées par OpenAI, Runway, Google et Meta pour leurs modèles respectifs. Mais contrairement à tous les autres, Adobe affirme que son modèle est entraîné exclusivement sur du contenu sous licence, ce qui pourrait éviter les problèmes éthiques et de droits d'auteur rencontrés par d'autres outils d'IA générative - pareil que pour son modèle Firefly Image dédié à la génération d’images comme son nom l’indique.
Adobe a aussi montré Project Super Sonic, un prototype expérimental qui utilise l'IA pour générer des effets sonores et des bandes sonores pour les vidéos. Cette technologie permet non seulement de créer des sons à partir de descriptions textuelles, mais aussi de générer des effets sonores en cliquant sur des objets dans une vidéo ou en imitant vocalement les sons souhaités.
Adobe a enfin présenté plusieurs outils d'IA encore en développement dédiés à l'animation et à l'édition 3D. Parmi eux, "Project Scenic" offre un contrôle quasi total sur la génération d'images en créant des scènes 3D modifiables, "Project Motion" facilite l'animation de graphiques, et "Project Clean Machine" automatise la suppression d'éléments indésirables dans les vidéos et les images.
Pourquoi est-ce important ? Adobe semble avoir pour ambition de transformer les processus de création de contenu, en rendant accessibles à un plus grand nombre de créateurs des techniques jusqu'ici réservées aux professionnels.
Sources : Ars Technica, Tech Crunch, The Verge
🐢🥷 Les Ministraux de Mistral : des modèles au bout des pouces - et qui mangent des pizzas
Mistral AI, la start-up française spécialisée dans l'intelligence artificielle, a annoncé le lancement de deux nouveaux modèles de langage : Ministral 3B et Ministral 8B. Ces modèles, collectivement appelés "les Ministraux" - on a perdu la French Tech subventionnée (adieu JEI et CII) mais au moins on se marre en France, enfin ceux qui vont rester encore un moment - sont conçus pour inférer directement en local sur des appareils comme les smartphones ou les laptops.
Malgré leur taille réduite, ces modèles affichent des performances impressionnantes - de vraies Teenage Mutant Ninja Turtles. Ministral 3B, avec seulement 3 milliards de paramètres, surpasse le modèle original de Mistral à 7 milliards de paramètres sur la plupart des critères d'évaluation. Son grand frère, Ministral 8B, rivalise avec des modèles plusieurs fois plus volumineux. Les deux modèles prennent en charge des séquences de contexte allant jusqu'à 128 000 tokens, ce qui équivaut à environ 100 pages de texte.
Ces nouveaux modèles ouvrent la voie à des applications jusqu'alors considérées comme peu pratiques en raison de contraintes de connectivité ou de confidentialité. Ils permettent notamment la traduction sur appareil, les assistants intelligents sans connexion Internet, l'analyse locale et la robotique autonome. Mistral AI positionne ces modèles comme complémentaires aux systèmes plus volumineux basés sur le cloud, permettant des architectures flexibles où les appareils mobiles gèrent les tâches courantes tandis que les requêtes plus complexes sont acheminées vers des modèles plus puissants dans le cloud.
Pourquoi est-ce important ? L'introduction de ces modèles d'IA compacts et performants, chez Mistral comme chez les concurrents, devrait démocratiser l'accès pour toutes et tous aux modèles d’IA en offrant de nouvelles possibilités en termes de confidentialité et d'efficacité énergétique.
Sources : Mistral AI, Tech Crunch, Venture Beat
🏭 Les nouvelles fonctionnalités de Perplexity
Alors que le New York Times met en garde Perplexity et lui demande de cesser d’utiliser ses informations dans les résultats qu’il délivre à ses utilisateurs et que ce dernier lui répond en substance que “Personne n'a de droit d'auteurs sur les faits”, le moteur de recherche dopé à l’IA lance deux nouvelles fonctionnalités : la recherche de connaissances internes - mini RAG forever - et les espaces de collaboration.
La recherche de connaissances internes permet aux utilisateurs de Perplexity Pro et Enterprise Pro d’effectuer des recherches à la fois dans leurs fichiers internes et sur le web. Cette fonctionnalité veut améliorer l'efficacité de la recherche en combinant des sources internes et externes dans une seule plateforme consolidée. Les utilisateurs peuvent télécharger jusqu'à 500 fichiers dans leur référentiel d'entreprise, accessibles à tous les membres de leur organisation. La plateforme prend en charge divers formats de fichiers, notamment Excel, PowerPoint, Word, PDF et CSV. Les résultats de recherche incluent des citations en ligne, permettant aux utilisateurs d'identifier facilement la source de l'information, qu'elle provienne du web ou des fichiers internes.
En parallèle, Perplexity a lancé les "Espaces", des hubs de collaboration alimentés par l'IA. Ces espaces permettent aux utilisateurs individuels et aux équipes de partager et d'organiser leurs recherches, de personnaliser l'assistant IA de Perplexity avec des instructions spécifiques, et de contrôler l'accès aux informations. Les utilisateurs peuvent ainsi créer des versions personnalisées de Perplexity adaptées à des projets ou des sujets spécifiques, en téléchargeant des ensembles de connaissances internes et en sélectionnant des modèles d'IA avancés pour répondre à leurs questions.
Pourquoi est-ce important ? Ces nouvelles fonctionnalités de Perplexity montre que la frontière entre search, modèles de langage et bases de connaissances est en train de disparaitre tant pour les individus que pour les organisations.
Sources : Perplexity, The Wall Street Journal, Venture Beat
🚀 3 infos en plus
ChatGPT has a Windows app now (The Verge)
Google Fixes AI Structural Flaw (The Information)
🔴 A lire sur IA-Pulse Hors Série
🧠 L’article qui fait réfléchir - et qu’il faut absolument lire
Your mind needs chaos
Further Down the Spiral
L'esprit humain est une merveille d'adaptation, façonné par l'évolution pour naviguer dans un monde incertain. Notre expérience du monde n'est pas une simple réception passive d'informations sensorielles, mais une construction active, une simulation élaborée par notre cerveau - coucou Jean-Yves. Cette faculté prédictive est essentielle à notre survie, nous permettant de planifier et d'agir efficacement dans notre environnement.
Peut-être paradoxalement, c'est notre ouverture à l'incertitude qui stimule notre croissance et notre épanouissement. Loin d'être un obstacle, elle joue un rôle moteur en stimulant notre créativité et en nous poussant à dépasser les limites de nos modèles mentaux. En nous exposant volontairement à des situations qui défient nos attentes, nous renforçons notre capacité à gérer l'inattendu et à évoluer.
Les expériences qui nous mènent au bord d’un "chaos informationnel" - comme l'art, les films d'horreur, la méditation profonde ou l'exploration de nouveaux domaines - sont autant de moyens de remettre en question nos certitudes. Elles nous invitent à revisiter nos perceptions, à élargir nos horizons cognitifs et à renouveler notre compréhension du monde. En affrontant l'inconnu, nous évitons de tomber dans des schémas répétitifs et potentiellement destructeurs, tels que la dépression ou l'addiction.
La créativité, loin d'être en opposition avec notre nature prédictive, en est le complément indispensable. Elle nous permet d'explorer les frontières de nos modèles mentaux, de les remettre en question et de les affiner. Cette danse entre prédiction et innovation est au cœur même de la vie, qui peut être vue comme une résistance perpétuelle à l'entropie.
Cette perspective suggère que le bien-être ne réside pas uniquement dans la minimisation de l'incertitude, mais dans une danse harmonieuse avec elle - oh que cette phrase est belle… tu as trouvé ça tout seul o1 ? - En embrassant le désordre et en acceptant la fluidité de la réalité, nous renforçons notre résilience et notre capacité à nous adapter - tu te surpasses o1. La créativité devient alors non seulement une expression artistique, mais aussi un outil fondamental pour naviguer dans la complexité de l'existence.
Face à ces idées, une réflexion s'impose sur notre rapport à l'incertitude et au chaos. Comment pouvons-nous les intégrer de manière constructive dans nos vies pour en tirer une croissance personnelle et collective ? Peut-être est-il temps de repenser notre quête de contrôle absolu et de voir dans l'imprévisible non pas une menace, mais une opportunité inestimable d'approfondir notre humanité et d'enrichir notre expérience du monde.
📻 Le podcast de la semaine
Yann Ferguson - Etudier le réel impact de l'IA au travail
Le LaborIA étudie l'impact de l'IA au travail. 20% des Français l'utilisent. Yann Ferguson, son directeur, discute des bonnes pratiques et des défis liés à son adoption professionnelle dans cet épisode des Carnets de l’IA de Manuel Davy.
👨🏽🦳👩🏽🦳 C’était mieux avant - Il y a 1 an
N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai
Partagez cette newsletter
Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !
Bon weekend.