Le bon sens

Will you bite the hand that feeds?

sept. 02, 2023

Bienvenue sur IA Pulse Weekend. En vous abonnant, vous recevez tous les samedis matin, l’essentiel de ce qu’il s’est passé cette semaine autour de l’IA : une sélection de 3 articles avec pour chacun un résumé rapide à lire, plus 1 article de fond pour ouvrir l’esprit et réfléchir, et pour finir 1 podcast à écouter.

⏱️Temps de lecture de cette newsletter par une unité carbone : 7 mins

Pour la rentrée, OpenAI veut aider les professeurs et leur propose un guide pour “bien” utiliser ChatGPT pour éduquer les enfants. Et que trouve-t-on dans ce guide au détour d’un paragraphe ? Le créateur de ChatGPT reconnait explicitement qu’il est quasi impossible de détecter correctement un texte IA. Les “détecteurs” ne sont pas fiables et étiquettent souvent de manière erronée les contenus générés par l'homme comme étant générés par l'IA. Ce n’est pas faute de le répéter très souvent ici : ceux qui nous vendent des classifieurs et des détecteurs sont au mieux des chanteurs de charme, au pire des vendeurs de poudre de perlimpinpin. Il faut se rendre à l’évidence, seul le bon sens humain nous aide à nous faire une opinion sur une production textuelle.

Et le bon sens, c’est comme un avis, nous avons tous le notre.

Cette semaine nous pouvons célébrer une naissance : celle d’Ernie Bot, l’IA conversationnelle développée par Baidu à destination du marché chinois. Bien évidemment Ernie, acronyme de “Enhanced Representation through Knowledge Integration” - tout un programme, est soumis à la ligne du Parti et ne serait s’en éloigner. Le bon sens, c’est par là.
Toujours du coté de l’Asie, Google a lancé en test son SGE en Inde et au Japon. SGE (Search Generative Experience) c’est le renouveau de la recherche sur Internet selon Google : une bonne dose d’IA générative pour répondre directement à nos questions. Et même si Google essaie d’amadouer les éditeurs de sites web en “améliorant” le rendu de SGE pour y intégrer des liens visuels vers les sources, notre bon sens veille et personne n’est dupe : SGE sonne la fin de l’ère des liens directs et de l’apport massif de trafic par la recherche. Un changement d’époque.
Pour terminer coté actu, on parle encore et toujours d’OpenAI, qui non seulement parle aux enseignants comme évoqué plus haut, mais aussi a enfin décidé de s’adresser directement aux entreprises avec une version dédiée de ChatGPT sobrement baptisée : ChatGPT Enterprise. On ne connait pas encore les tarifs, mais ils devraient être à la hauteur des caractéristiques de cet abonnement.

Et pour réfléchir, je vous propose d’alimenter vos process cognitifs avec un texte de Benedict Evans, un nom qui dit peut être quelque chose à certains. Ben Evans revient sur la notion de copyright, de propriété intellectuelle et de droits sur les productions cognitives humaines à l’heure des grands modèles de langage et des IA générative. Un texte qui a fait beaucoup parler le bon sens des journalistes, des artistes et des éditeurs cette semaine.

Bonne rentrée à toutes et à tous.

📰 Les 3 infos de la semaine

🌏Baidu launches Ernie chatbot after Chinese government approval

The Verge, 31/08/2023

Après avoir reçu l'approbation du gouvernement chinois, Baidu lance officiellement son chatbot baptisé Ernie Bot. Ernie Bot est disponible au téléchargement sur les app stores et le site web de Baidu. Il permet aux utilisateurs de poser des questions, d'aider à rédiger des analyses de marché, de proposer des slogans marketing et de résumer des documents.

Le chatbot est accessible dans le monde entier, mais nécessite un numéro de téléphone chinois pour l'inscription. Baidu a également ouvert un marché de plug-ins similaire à ceux de ChatGPT. Ernie a dépassé 1 million d'utilisateurs dans les 19 premières heures suivant son lancement.

Les directives de l'IA générative en Chine stipulent que les entreprises doivent "adhérer aux valeurs fondamentales du socialisme", et que leurs modèles doivent refléter ces valeurs fondamentales du socialisme chinois pour obtenir l’autorisation de mise sur le marché.

👑 Google's AI-powered search summary now points you to its online sources

Zdnet, 01/09/2023

Google a apporté cette semaine des modifications à sa fonctionnalité de recherche alimentée par l'IA, Search Generative Experience (SGE). Désormais, SGE inclut des miniatures des sources utilisées pour générer les résumés de recherche, permettant aux utilisateurs d'accéder directement aux sites Web source. Cette mise à jour vise à donner de la visibilité aux sources utilisées et à répondre aux critiques sur le manque de transparence.

Mais l'impact sur les sites des médias risque quand même d’être très significatif en termes de trafic. La crainte d'une perte de revenus et de visibilité va entraîner des changements dans les modèles de monétisation de ces sites. Les médias cherchent actuellement activement à être rémunérées pour l'utilisation de leur contenu.

Parallèlement à ces améliorations, Google a étendu SGE à l'Inde et au Japon, marquant la première expansion de cette technologie en dehors des États-Unis. Les utilisateurs dans ces pays peuvent utiliser SGE dans leurs langues locales, ce qui indique une volonté d’adapter SGE aux spécificités culturelles.

🧑🏻‍💼OpenAI introduces ChatGPT Enterprise for businesses

Ars Technica, 28/08/2023

OpenAI annonce une version de ChatGPT dédiée aux entreprises. Cette version entreprise propose des fonctionnalités avancées, notamment un accès illimité à GPT-4 et des fenêtres de contexte étendues capables de traiter jusqu'à 32 000 tokens. OpenAI n’a pas encore communiqué sur le prix de cet abonnement entreprise.

Sur le plan de la sécurité, ChatGPT Enterprise offre un chiffrement des données et est conforme aux normes SOC 2, ce qui devrait rassurer les entreprises soucieuses de la protection de leurs données. ChatGPT est déjà en usage dans plus de 80 % des entreprises du Fortune 500 pour diverses applications, allant de la communication à l'accélération des tâches de codage.

Cependant, l'article soulève des questions sur l'utilité réelle de ChatGPT en entreprise. Il s'interroge notamment sur la possibilité que ChatGPT devienne un outil aussi fondamental que les tableurs par exemple, et sur les limitations inhérentes aux modèles de langage de grande taille du fait de leur nature probabiliste.

🧠 L’article qui fait réfléchir - et qu’il faut absolument lire

Benedict Evans : Generative AI and intellectual property

But I keep holding on and on and on and on

L'article de Benedict Evans aborde la question complexe de la propriété intellectuelle à l'ère de l'IA générative. Il souligne que les LLM, comme GPT, ne sont pas des bases de données ou des oracles, mais des outils qui infèrent des modèles à partir de grandes quantités de texte. Contrairement à une base de données qui stocke des informations, ces modèles apprennent des schémas linguistiques et des structures logiques à partir de données d'entraînement, mais ne les conservent pas. Ils sont conçus pour généraliser à partir de ces schémas pour générer du texte, mais sans accéder à une "mémoire" de données spécifiques.

Cette distinction est cruciale pour les questions de propriété intellectuelle. Par exemple, si un modèle génère une chanson dans le style de Taylor Swift, il ne puise pas dans une base de données de ses chansons, mais utilise plutôt les schémas qu'il a appris à partir de diverses données pour créer quelque chose de nouveau. Cela soulève la question de savoir si l'utilisation de ces schémas constitue une violation de la propriété intellectuelle. De même, si un modèle résume des articles de journaux, il ne "copie" pas le contenu, mais génère un résumé basé sur sa compréhension générale du langage et des structures narratives.

Evans suggère alors que l'IA générative pourrait changer la nature même des lois sur la propriété intellectuelle en raison de l'échelle à laquelle elle peut être déployée. Il est une chose de demander à un stagiaire de lire et de résumer des articles de journaux, mais c'est une autre chose de le faire à grande échelle avec un modèle de langage, ce qui pourrait potentiellement dévaloriser totalement le travail original et spolier les auteurs.

Benedict Evans nous invite à réfléchir à la manière dont les lois et les normes éthiques doivent évoluer pour prendre en compte la nature unique des modèles de langage et les IA génératives, qui ne sont ni des bases de données, ni des bases de connaissances, mais des outils capables de créer du contenu à une échelle sans précédent.

Parce que ces modèles de langage, imaginés certainement par des Sages n’ayant que pour seul but d’imiter les humains le mieux possible - et certainement pas de générer des revenus, ces modèles ont par nature le pouvoir de brouiller les lignes entre la création et la copie, entre l'original et le dérivé.

📻 Le podcast de la semaine

IAtus : Bard, le ChatGPT de Google

Focus IAtus est le premier épisode nouvelle génération de IAtus, le podcast proposé par Laura Ghazal et Gilles Guerraz.

En quelques minutes Laura et Gilles font le point sur Bard et son positionnement par rapport à ChatGPT. C’est concis, clair et didactique.

N’hésitez à me contacter si vous avez des remarques et suggestions : olivier@255hex.ai

Partagez cette newsletter

Et si vous n’êtes pas abonné, il ne tient qu’à vous de le faire !

Bon weekend !

IA-Pulse

Discussion à propos de ce post