Vanille ? Non, fraise.
Maintenant que le ciel n’a plus de mur, laissons nous glisser dans l’ouverture
Bienvenue sur IA Pulse Weekend. Cette édition porte le numéro 73. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : un coup de gueule édito, une sélection de 3 actualités avec pour chacune un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir et 1 podcast à écouter.
⏱️Temps de lecture de cette newsletter par une unité carbone : 8 mins
Comment savez-vous que vous faites partie des très très très très grands qui participent à un phénomène qui structure notre société économique et financière occidentale ?
Vous êtes valorisé à plus de 100 milliards, comme OpenAI. Les autres très très très très grands investissent ou veulent investir chez vous, comme Apple et Nvidia à la suite de Microsoft, dans OpenAI - ou comme Amazon et Google dans Anthropic. Les services officiels liés à la sécurité de votre pays veulent savoir ce que vous faites, comment et avec qui, comme aux US avec OpenAI et Anthrophic. Vous faites évoluer, en votre faveur, les projets de lois qui vous concernent, comme Anthropic et OpenAI avec l’AI Bill en Californie. Vous embauchez comme cadres dirigeants, ou mieux encore, vous faites entrer dans votre board d’anciens politiques ou d’anciens membres des “services”, comme tous les autres très très très très grands.
Et bien entendu chaque annonce et chaque parole qui viennent de vous et de vos représentants officiels, ou officieux, sont diffusées et commentées dans la seconde même. Vous postez une photo de fraises pour teaser votre prochain modèle. Vous maitrisez tellement la communication “moderne” que vous êtes Communication. Et tout ça uniquement car vous exploitez une technologie probabiliste de complétion de mots et de phrases - oui j’exagère : les Transformers et les autres outils qui les accompagnent. Wahou…
Chères amies et chers amis, si vous rentrez de vacances ce weekend et revenez à la vie réelle, sachez que rien ne s’est arrêté cet été. C’est aussi à ça qu’on les reconnait.
Nouveauté de cette semaine dans IA-Pulse : pour celles et ceux qui ont le temps, vous trouverez des liens vers 3 infos en plus, après celles développées ici.
Bonne rentrée.
Cette semaine la partie de cette newsletter gérée par l’IA, les 3 clusters d’articles, a été générée par Claude-3.5-Sonnet pour les résumés des articles sources, la génération du cluster et de son titre. Comme d’habitude j’ai fait quelques modifications, mais j’ai aussi laissé quelques tournures typiques des modèles de langage. Et bien entendu, mes commentaires éventuels sont en italique dans ces résumés. Le texte de “l’article qui fait réfléchir” est issu d’un ping-pong entre GPT-4o et Claude-3.5-Sonnet.
L’image d’illustration ci-dessous est générée par Midjourney.
📰 Les 3 infos de la semaine
👨🏫Anthropic publie les directives de Claude
Anthropic - fondée par d'anciens d'OpenAI, ne l’oublions pas ^^ - a publié cette semaine les prompts système de ses modèles Claude, offrant ainsi un aperçu réel du fonctionnement interne de ses chatbots.
Les prompts système sont des instructions - normalement cachées à l’utilisateur - qui définissent le comportement et les capacités d'un modèle de langage. Considérées comme des informations propriétaires, ces directives jouent un rôle essentiel dans la formation des réponses des modèles d'IA. Anthropic a rendu publics les prompts pour Claude 3.5 Sonnet, Claude 3 Opus et Claude 3 Haiku, ses modèles les plus récents.
Ces instructions révèlent des détails intéressants sur chaque modèle. Par exemple, Claude 3.5 Sonnet, le plus avancé, possède une base de connaissances mise à jour en avril 2024. Il est conçu pour fournir des réponses détaillées aux questions complexes et des réponses concises aux tâches simples. Le modèle est également programmé pour traiter les sujets controversés avec prudence, en présentant les informations sans les qualifier explicitement de sensibles - un modèle qui veut faire plaisir à ses utilisateurs, comme tous les autres modèles, mais peut-être plus…
La démarche d’Anthropic contraste avec celle d'autres grandes entreprises d'IA comme OpenAI, Meta ou xAI, qui gardent leurs prompts système confidentiels. La publication de ces prompts offre aux utilisateurs et aux développeurs une meilleure compréhension du fonctionnement des chatbots de la famille Claude. Et surtout, cela peut aider les utilisateurs à améliorer leurs interactions avec les modèles en formulant des requêtes plus efficaces.
Pourquoi est-ce important ? Du point de vue des utilisateurs, la divulgation des prompts système va permettre de mieux comprendre pourquoi certaines interactions sont déceptives. Pour l’industrie, Anthropic et sa démarche vont peut-être pousser les autres entreprises du secteur à être moins cachotières - y compris xAI avec Grok.
Sources : Anthropic, TechCrunch, VentureBeat, Decrypt
🕹️ GameNGen génère Doom en temps réel
Des chercheurs de Google et de l'Université de Tel-Aviv ont développé GameNGen, un nouveau modèle d'IA capable de simuler en temps réel le jeu classique Doom de 1993, et cela sans utiliser de moteur de rendu graphique traditionnel.
GameNGen utilise une version modifiée de Stable Diffusion 1.4, un modèle de diffusion, pour générer les images du jeu en temps réel, produisant un gameplay jouable à 20 images par seconde. Le système a été entraîné en deux phases : d'abord, un agent d'apprentissage par renforcement a été formé pour jouer à Doom, et ses sessions de jeu ont été enregistrées pour créer un ensemble de données d'entraînement. Ces données ont ensuite servi à entraîner le modèle Stable Diffusion personnalisé.
Le modèle a des problèmes, notamment des artefacts visuels dus à la compression des images et des difficultés à maintenir la cohérence visuelle au fil du temps. Les chercheurs ont développé des techniques pour atténuer ces problèmes, comme l'ajout intentionnel de bruit aléatoire aux données d'entraînement. GameNGen a aussi de nombreuses limitations. Le système est actuellement conçu pour un seul jeu et n'a accès qu'à trois secondes d'historique, ce qui limite sa capacité à reproduire fidèlement des niveaux précédemment visités.
Malgré ces limitations, GameNGen ouvre de nouvelles perspectives pour l'industrie du jeu vidéo. Il suggère la possibilité de créer de nouveaux jeux via des descriptions textuelles ou des images exemples, plutôt que par programmation traditionnelle. Cette technologie pourrait potentiellement réduire les coûts et les temps de développement des jeux, démocratisant ainsi la création de jeux vidéo.
Pourquoi est-ce important ? GameNGen représente peut-être une étape vers un nouveau paradigme dans le développement de jeux vidéo, où les jeux pourraient être créés et alimentés par l'IA plutôt que par des lignes de code traditionnelles.
Sources : GameNGen, ArsTechnica, VentureBeat
🥅 La collecte de données d'Apple pour l'IA face à la résistance des éditeurs
Apple a lancé au cours de l’été un nouveau bot nommé Applebot-Extended - un peu comme Meta voir l’édition précédente. Ce bot dédié à l’IA est présenté comme une extension du robot et scrapeur de contenus Applebot qui alimente des services comme Siri et Spotlight. Sa mise en fonction doit permettre aux éditeurs de mieux contrôler si leurs données peuvent être utilisées pour entraîner les modèles d'IA d'Apple.
Plusieurs grandes plateformes et éditeurs ont déjà choisi d'exclure leurs données de l'entraînement de l'IA d'Apple. Parmi eux figurent Facebook, Instagram, Craigslist, Tumblr, The New York Times, The Financial Times, The Atlantic, et d'autres. Contrairement à d'autres géants de la tech, Apple a pourtant proposé des compensations financières aux éditeurs pour le droit de scraper leurs sites, mais cela n'a pas suffi à convaincre tous les acteurs. Le New York Times, par exemple, a été l'un des premiers à refuser, citant des préoccupations en matière de droits d'auteur et de monétisation de leurs contenus.
Les propriétaires de sites web peuvent bloquer Applebot-Extended en mettant à jour un fichier texte sur leurs sites appelé robots.txt. Ce fichier régit depuis longtemps la manière dont les robots explorent le web, et il est maintenant au centre d'un débat plus large sur la façon dont l'IA est entraînée.
Bien qu'Applebot-Extended soit relativement nouveau, des analyses récentes montrent qu'environ 6 à 7 % des sites web US à fort trafic le bloquent déjà . Ce chiffre pourrait augmenter à mesure que les propriétaires de sites prennent conscience de cette option.
En France les sites de Condé Nast - tiens tiens - et de TF1 interdissent déjà Applebot-Extended. Pour les intéressés, voici la mise à jour de la liste des sites médias français qui interdissent les bots IA : Quels sites bloquent les bots IA en France le 28 août 2024 ?
Pourquoi est-ce important ? L'approche d'Apple et la réaction des éditeurs montre une fois de plus le rôle clé de la collecte des données pour l'entraînement de l'IA, et la difficulté du modèle économique à mettre en place.
Sources : Wired, Apple Insider
🚀 3 infos en plus
The controversial California AI bill that has divided the tech world (Axios)
AI company Midjourney teases hardware product in a new form factor (ArsTechnica)
Meta AI Had At Least 400 Million Monthly Active Users in Early August (The Information)
🧠 L’article qui fait réfléchir - et qu’il faut absolument lire
Post-apocalyptic education - What comes after the Homework Apocalypse
Personne n’est parfait
L’arrivée de l’A dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, une grande majorité des élèves et des étudiants, du primaire à l'université, utilisent l'IA pour leurs travaux scolaires, bouleversant ainsi les méthodes traditionnelles d'enseignement et d'évaluation.
Cette situation n'est pas sans rappeler l'impact qu'a eu Internet - et ensuite Wikipédia - sur les devoirs il y a quelques années. L'IA ne fait qu'accentuer une tendance déjà existante : la recherche de moyens pour éviter l'effort mental, perçu comme désagréable par beaucoup. Cependant, dans le contexte éducatif, cet effort est précisément ce qui permet l'apprentissage.
Deux illusions principales compliquent la gestion de ce phénomène. D'une part, les enseignants croient pouvoir facilement détecter l'utilisation de l'IA, ce qui n'est pas le cas en réalité. D'autre part, les étudiants ne réalisent pas que l'utilisation de l'IA pour leurs devoirs peut nuire à leur apprentissage réel, confondant l'aide apportée par l'IA avec une véritable compréhension.
Et pourtant l'IA n'est pas nécessairement néfaste pour l'éducation. Des études ont montré qu'une utilisation encadrée et réfléchie de l'IA peut améliorer les résultats sans compromettre l'apprentissage. L'enjeu est donc de repenser l'intégration de l'IA dans l'éducation, en la considérant comme un outil de co-intelligence plutôt qu'un substitut à la réflexion humaine.
Cette approche implique de placer les enseignants au cœur du processus d'utilisation de l'IA. Il s'agit de développer des méthodes qui encouragent la réflexion critique des élèves, les poussant à confronter leurs connaissances réelles et à approfondir leur compréhension.
L'intégration de l'IA dans l'éducation est désormais une réalité. Elle nécessite une refonte fondamentale de nos méthodes d'enseignement, d'apprentissage et d'évaluation. L'objectif n'est pas de surpasser l'IA ou de l'ignorer, mais de l'utiliser pour améliorer l'éducation tout en atténuant ses inconvénients potentiels.
📻 Le podcast de la semaine
L'Invité au Carré : Alain Damasio
Comme c’est la rentrée, on va continuer de rêver - ou pas . Alain Damasio nous alerte sur les technologies aliénantes et propose de renouer avec le vivant pour sortir du "techno-cocon"
👨🏽🦳👩🏽🦳 C’était mieux avant - Il y a 1 an
Everybody Wants to Rule the World, et ça n’a toujours pas changé ;)
Un salut amical à Nicolas Guyon de passage cette semaine à Biarritz au Connecteur pour Shaka Biarritz - image non synthétique ^^ capturée mardi 27 août. Un prochain Comptoir IA ?
N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils IA et d’IA générative : olivier@255hex.ai
Partagez cette newsletter
Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !
Bon weekend.