o1 d'OpenAI : premiers conseils pour bien utiliser le modèle
Après quelques jours d'utilisation, voici quelques directives simples pour prompter o1
Temps de lecture : 3 mins
En fin de semaine dernière, OpenAI a lancé son nouveau modèle qui “raisonne”. Je ne vais pas revenir sur les questions de performances, d’architectures ou encore les questions méta-physique sur “le modèle raisonne-t-il vraiment ou pas”.
Non, ici je vous livre quelques conseils après ces quelques jours d’utilisation. D’ailleurs, Ô Grand Sam Altman merci d’avoir augmenté aujourd’hui la limite du nombre de requêtes pour utiliser le modèle o1.
Mais trêve de bavardages. Voilà les 8 conseils que je peux partager après ces quelques jours d’utilisation et de tests.
8 conseils simples pour bien prompter le modèle o1
Poser un problème plutôt qu’une tâche
Formulez votre prompt comme un problème à résoudre plutôt que comme une tâche précise à exécuter. Cela permet ainsi au modèle d’utiliser pleinement ses propres capacités de raisonnement.Utiliser des prompts simples et directs
Le modèle o1 excelle lorsqu’on lui fournit des instructions claires et concises. Évitez les prompts complexes ou contenant trop de détails superflus.
Par exemple, préférez une question directe comme "Résous ce problème" plutôt que d’expliquer comment il devrait procéder.
Évitez les techniques complexes comme le "few shot" (Fs) ou le "Chain of Thought" (CoT).Ne pas forcer le raisonnement explicite
Ne lui demandez pas de “raisonner étape par étape”, ou encore de “réfléchir” avant de répondre. Le modèle effectue automatiquement un raisonnement interne grâce à l’utilisation des “reasoning tokens”. Évitez de lui demander de détailler son raisonnement ou de suivre des étapes spécifiques, car cela pourrait nuire à ses performances.Limiter le contexte fourni
Lors de l’utilisation du modèle o1, ne donnez que les informations les plus pertinentes dans le prompt : une grosse partie de notre travail d’humain est là → définir la pertinence des éléments de notre contexte.
Un excès de contexte peut entraîner une confusion ou des réponses trop compliquées.Utiliser des délimiteurs pour organiser le prompt
Structurez votre prompt en utilisant des délimiteurs comme des guillemets triples (ceux qui ont suivi mes interventions et mes formations doivent se rappeler des guillemets triples), des balises XML ou des titres de section. Cela permet au modèle de mieux comprendre et interpréter les différentes parties de l’entrée.Gérer la fenêtre contextuelle (API)
Prenez en compte la taille de la fenêtre contextuelle. Assurez-vous qu’il reste suffisamment de place pour que le modèle puisse générer une réponse complète et les tokens de raisonnement. Quand vous passez par l’API, ajustez le nombre maximal de tokens générés en conséquence. Soyez conscient de la fenêtre de contexte global de 128 000 tokens d'o1.Prendre en compte les tokens de raisonnement (API)
Soyez bien conscient que o1 utilise des tokens de raisonnement pour "réfléchir" avant de répondre. Ces tokens ne sont pas visibles mais occupent de l'espace dans la fenêtre de contexte et sont facturés comme des tokens de sortie si vous utilisez l’API. La recommandation est de réserver au moins 25 000 tokens pour le raisonnement et la sortie.Adapter le prompt selon la version du modèle
Utilisez la version appropriée du modèle selon la tâche : o1-preview pour des tâches complexes nécessitant un raisonnement approfondi, et o1-mini pour des tâches plus simples, où le temps de réponse rapide est un facteur clé.
N’hésitez pas à laisser un commentaire si vous avez d’autres conseils, des remarques ou des questions.
N’hésitez à me contacter si vous avez des remarques et suggestions sur cette newsletter, ou si dans votre entreprise vous cherchez à être accompagnés dans l’intégration d’outils d’IA générative : olivier@255hex.ai
Et n’oubliez pas de vous abonner pour recevoir IA-Pulse
Bonjour Olivier, merci pour la newsletter. Pourriez-vous décrire plus précisément par ce que vous voulez dire au point 5 dans les techniques de promptage et la délimitation du prompt en particulier les guillemets triples et balises XML.
Merci pour vos newsletters qui sont toujours pertinentes et intéressantes! Crystal, avocate en Suisse (cd@bonnard-lawson.com)