Un nouveau collègue arrive lundi. Vous lui confiez une tâche. Trois options : lui expliquer en une phrase et le lancer ; lui montrer un exemple déjà fait ; ou lui en montrer plusieurs avant qu’il s’y mette. Plus vous donnez d’exemples, plus il vise juste. Avec une IA, c’est identique — et cela porte trois noms : zero-shot, one-shot, few-shot. C’est sans doute le réglage le plus simple et le plus rentable de tout l’art du prompt.
Définition : la même idée, à trois hauteurs
On peut demander une tâche à une IA sans exemple (zero-shot), avec un exemple (one-shot) ou avec quelques exemples (few-shot). Plus on en montre, mieux elle comprend le format et le résultat attendus.
Ces trois modes désignent le nombre d’exemples placés dans le prompt pour guider la réponse. C’est de l’apprentissage « en contexte » : le modèle ne réapprend rien, il s’aligne sur vos exemples le temps d’une requête.
L’apprentissage en contexte (in-context learning) conditionne la génération sur k démonstrations fournies dans l’invite (k = 0, 1 ou n), sans mise à jour des poids — par opposition au fine-tuning, qui modifie les paramètres.
L’analogie-maîtresse : le nouveau collègue et la tâche à confier
Disons que la tâche est de trier des e-mails entrants en « urgent » ou « non urgent ». Voyons les trois façons de la confier à votre nouvelle recrue.
Zero-shot — la consigne seule. Vous dites : « Classe ces e-mails en urgent ou non urgent. » Aucun exemple. La recrue se débrouille avec son bon sens. Souvent ça marche, mais elle peut se tromper sur votre définition d’« urgent », ou répondre dans un format inattendu.
One-shot — un exemple. Vous ajoutez : « Tiens, regarde : “Le serveur est tombé” → urgent. À toi. » Ce seul exemple lève l’ambiguïté : la recrue saisit à la fois le critère et le format de réponse. Le gain par rapport à zéro exemple est souvent spectaculaire.
Few-shot — quelques exemples. Vous en montrez trois ou quatre, dont des cas limites : « “Réunion déplacée à jeudi” → non urgent ; “Client menace de résilier” → urgent. » La recrue cerne désormais les nuances et devient fiable, y compris sur les situations ambiguës.
Point crucial : dans les trois cas, vous n’avez rien « formé » du tout. La recrue n’a suivi aucune formation, modifié aucune compétence durable. Elle s’est simplement appuyée sur ce que vous lui mettiez sous les yeux, le temps de la tâche. C’est précisément ce qui distingue ces « shots » du fine-tuning : le fine-tuning, lui, change durablement le savoir-faire du modèle ; les shots ne font que le guider sur l’instant. De même, le RLHF ajuste le modèle en profondeur, tandis que le few-shot agit uniquement dans votre prompt, sans rien modifier.
Cette mécanique découle directement de la façon dont fonctionnent les grands modèles de langage : en complétant un texte de la manière la plus cohérente, ils prolongent naturellement le motif « exemple → réponse » que vous avez amorcé. Vos exemples deviennent le début d’un patron qu’ils poursuivent.
Là où l’analogie s’arrête. Un vrai collègue se souvient de vos exemples la semaine suivante ; l’IA, non. Chaque nouvelle conversation repart de zéro : les exemples ne « restent » que dans la fenêtre de contexte du moment. Et plus vous empilez d’exemples, plus vous consommez cette fenêtre — il y a donc un équilibre à trouver entre guider assez et ne pas saturer.
Zero, one, few : le schéma
Déconstruction : du collègue au modèle
| Notion technique | Dans notre analogie | En réalité, sans jargon |
|---|---|---|
| Zero-shot | La consigne seule, sans exemple | On demande la tâche directement, sans démonstration |
| One-shot | Un exemple déjà fait | Une seule démonstration, qui lève l’ambiguïté de format |
| Few-shot | Quelques exemples, dont des cas limites | Plusieurs démonstrations qui couvrent les nuances |
| Apprentissage en contexte | La recrue s’appuie sur ce qu’elle a sous les yeux | Le modèle se guide sur les exemples sans rien réapprendre |
| Coût en contexte | Le temps d’explication qui s’allonge | Chaque exemple occupe de la place dans la fenêtre de contexte |
Ce que ça change pour vous
- Un exemple vaut mieux qu’une longue consigne. Face à une réponse décevante, votre premier réflexe ne devrait pas être de réécrire l’instruction, mais d’ajouter un exemple de ce que vous attendez.
- Le format se contrôle par l’exemple. Vous voulez une sortie en tableau, en JSON, en deux phrases ? Montrez-en un. Le modèle copie le motif bien plus fidèlement qu’une description.
- Les cas limites font la différence. En few-shot, glissez des exemples « pièges » proches de vos erreurs fréquentes. C’est là que la fiabilité se gagne.
- Pas besoin de fine-tuning pour beaucoup d’usages. Avant de payer un entraînement sur mesure, testez le few-shot : il résout, gratuitement et immédiatement, une large part des besoins courants. Pour aller plus loin, combinez-le avec le raisonnement pas à pas.
FAQ pour débuter
Les deux articles fondateurs
1. Radford et al. — GPT-2 et le transfert zero-shot (2019)
Contexte. À l’époque, chaque tâche de traitement du langage exigeait un modèle réentraîné spécifiquement. Pouvait-on faire autrement ?
Idée centrale. Un modèle de langage assez vaste peut accomplir des tâches variées sans entraînement dédié, simplement en formulant la tâche dans le texte d’entrée — le fameux réglage zero-shot.
Pourquoi ça compte. C’est la première démonstration nette qu’on peut « demander » une tâche à un modèle plutôt que de le réentraîner — l’idée matricielle du prompt.
✅ Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report.
2. Brown et al. — GPT-3 et l’apprentissage few-shot (2020)
Contexte. Le zero-shot fonctionne, mais reste fragile. Et si l’on glissait quelques exemples dans l’invite, sans rien réentraîner ?
Idée centrale. Les auteurs montrent qu’un très grand modèle accomplit de nombreuses tâches à partir de quelques exemples placés dans le prompt, et comparent explicitement les réglages zero-, one- et few-shot.
Pourquoi ça compte. C’est l’article qui a popularisé l’« apprentissage en contexte » et installé le vocabulaire zero/one/few-shot que l’on emploie aujourd’hui.
✅ Brown, T. B., Mann, B., Ryder, N., et al. (2020). Language Models are Few-Shot Learners. Advances in Neural Information Processing Systems, 33. (arXiv:2005.14165)
Trois prompts pour apprendre
Pose-moi la même tâche de classification d’abord en zero-shot, puis en few-shot avec 3 exemples, et montre-moi comment ta réponse change entre les deux.
🎯 Comparer | 📚 Ce qu’on apprend : voir de ses yeux l’effet des exemples.
Je veux des réponses au format « Titre : … / Résumé en 1 phrase : … ». Voici un exemple, reproduis exactement ce format pour les 3 textes que je te donne ensuite.
🎯 Contrôler le format | 📚 Ce qu’on apprend : le one-shot comme gabarit de sortie.
Aide-moi à choisir 4 exemples « few-shot » pour fiabiliser le tri de mes e-mails clients, en incluant au moins deux cas ambigus. Explique pourquoi chacun est utile.
🎯 Cas pratique | 📚 Ce qu’on apprend : choisir des exemples qui couvrent les cas limites.
📝 Note méthodologique. Cet article a été rédigé avec l’aide d’une IA générative, sur la base d’un gabarit pédagogique et d’analogies conçus par l’autrice. Les deux références fondatrices ont été vérifiées manuellement. L’objectif reste pédagogique : rendre un concept technique accessible aux étudiants et cadres en management.





















Laisser un commentaire