Comprendre la Chain of Thought des IA L’analogie avec un ingénieur automobile Exercices Prompts

Q: C'est quoi la différence entre répondre directement et faire de la CoT ?

Sans CoT, le LLM produit directement un résultat. Avec CoT, il documente chaque étape de son raisonnement. Pour des questions complexes impliquant plusieurs niveaux de causalité, la CoT améliore significativement la précision et la cohérence de la réponse.

Q: Est-ce que ChatGPT ou Claude font de la CoT automatiquement ?

Les modèles de raisonnement (o1, o3, Claude avec extended thinking, DeepSeek R1) ont été entraînés pour produire une CoT interne. Les modèles standard ne le font que si vous demandez explicitement de réfléchir étape par étape.

Q: Si l'IA montre ses étapes, est-ce que son raisonnement est forcément fiable ?

Non. La chain of thought rend le raisonnement visible et auditable, pas nécessairement juste. Le LLM peut générer des étapes intermédiaires statistiquement plausibles qui mènent à une conclusion incorrecte. La CoT vous donne les moyens de détecter l'erreur ; elle ne la supprime pas.

Sofia est ingénieure au sein du département powertrain d’un constructeur automobile européen. Ce matin, elle a sur son banc d’essai une voiture électrique qui perd 30 % d’autonomie en dessous de 5°C. Son chef lui demande : « Alors, c’est quoi le problème ? »

Sofia ne répond pas immédiatement. Elle ouvre son protocole de diagnostic et commence par le commencement : charge batterie, puis BMS, puis résistance interne à basse température, puis électronique de puissance, puis moteur. C’est à l’étape 3 que le problème apparaît — une résistance interne anormale dans le module 4, invisible à température ambiante, mais critique en conditions hivernales.

Sans ce cheminement visible, le problème restait invisible. C’est exactement ce que fait la chain of thought en intelligence artificielle.

Ce que « chain of thought » veut dire — à trois niveaux

Niveau 1 — Tout public

Quand tu résous un problème de maths, ton professeur te dit « montre tes calculs ». La chain of thought, c’est exactement ça pour l’IA : on lui demande de montrer son brouillon avant de donner la réponse finale.

Niveau 2 — Manager / Décideur

La chain of thought est une technique de prompting qui consiste à demander à un grand modèle de langage (LLM) de décomposer son raisonnement en étapes intermédiaires explicites, améliorant significativement la fiabilité de ses réponses sur des questions complexes.

Niveau 3 — Définition académique

Le chain-of-thought prompting est une méthode qui consiste à inclure dans le prompt une série d’étapes de raisonnement intermédiaires, incitant le modèle à générer sa propre chaîne de déductions avant de produire une réponse finale (Wei et al., 2022).

L’analogie du banc d’essai — l’ingénieure et son protocole

Sofia ne travaille pas à l’intuition. Elle suit un protocole de diagnostic documenté, séquentiel, que tout ingénieur de son équipe peut relire et vérifier. Chaque étape alimente la suivante. Si elle se trompe à l’étape 3, elle peut localiser l’erreur précisément en relisant son carnet de bord.

Un LLM sans chain of thought fonctionne comme une ingénieure qui, après un coup d’œil rapide, lance : « C’est probablement le module 4. » La réponse peut être correcte par chance — mais le raisonnement est une boîte noire. En cas d’erreur, impossible de comprendre pourquoi.

Avec chain of thought, le modèle est forcé d’écrire chaque étape de son diagnostic : « D’abord, je vérifie la charge de la batterie : 97 %, pas de problème apparent. Ensuite, le BMS signale une résistance interne anormale à basse température. Cela suggère une dégradation sélective des cellules. Je regarde module par module… » Chaque ligne devient auditable. L’erreur, si elle existe, devient localisable.

Cette technique est si puissante que Kojima et al. (2022) ont montré qu’il suffit d’ajouter la phrase « Réfléchissons étape par étape » à un prompt pour que les LLM améliorent spectaculairement leurs performances sur des problèmes de raisonnement arithmétique et logique — sans aucun exemple fourni au préalable.

⚠ Les limites de cette image

Sofia mesure une résistance physique réelle. Le LLM, lui, génère des étapes de raisonnement statistiquement plausibles, pas nécessairement vraies. Le modèle peut produire une chaîne de déductions impeccablement structurée qui mène à une conclusion fausse. Ses « instruments de mesure » sont des patterns de langage, pas des capteurs. La chain of thought rend le raisonnement visible et auditable — elle ne garantit pas sa véracité.

Les 5 composants de la chain of thought — décryptés

Dans l’analogieEn IA

La question complexe

Banc d’essai : La voiture perd 30 % d’autonomie en hiver. Pourquoi ?

LLM : Une question à plusieurs niveaux de causalité que le modèle ne peut pas résoudre en une seule association directe.

Dans l’analogieEn IA

Les étapes intermédiaires

Banc d’essai : Les 7 étapes du protocole de Sofia : batterie → BMS → résistance interne → modules → etc.

LLM : Les tokens générés par le modèle pour « montrer son raisonnement » avant la conclusion finale.

Dans l’analogieEn IA

La réponse finale

Banc d’essai : « Microfissures dans le module 4 — remplacement recommandé. »

LLM : La réponse finale produite après l’ensemble des étapes intermédiaires. Beaucoup plus fiable qu’une réponse directe.

Dans l’analogieEn IA

Few-shot CoT (avec exemples)

Banc d’essai : Sofia consulte un manuel de 50 cas résolus avant d’aborder son diagnostic.

LLM : On fournit au modèle des exemples « question + étapes + réponse » dans le prompt pour l’orienter.

Dans l’analogieEn IA

Zero-shot CoT

Banc d’essai : Sofia n’a pas de manuel. Elle suit mentalement sa checklist, sans exemples préalables.

LLM : Ajouter « Let’s think step by step » au prompt suffit à activer un raisonnement en étapes — sans aucun exemple.

Ce que ça change pour vous — 4 implications concrètes

🔧

Ajoutez « réfléchis étape par étape » à vos prompts complexes

Pour toute analyse dépassant une question factuelle simple — analyse concurrentielle, diagnostic d’une campagne, évaluation d’une offre — ajoutez simplement « réfléchis étape par étape avant de conclure » à votre prompt. L’amélioration de qualité est immédiate et mesurable.

🔍

Vérifiez les étapes, pas seulement la réponse finale

La chain of thought rend le raisonnement auditable. Apprenez à lire les étapes intermédiaires plutôt que de ne regarder que la conclusion. C’est là que se nichent les erreurs — et c’est là aussi que vous pouvez intervenir avec une correction ciblée.

⚙️

Combinez CoT avec la température du LLM

Pour des tâches d’analyse précise (audit, diagnostic), combinez une température basse et une instruction CoT. Vous obtenez un raisonnement structuré et déterministe — proche du protocole de Sofia sur son banc d’essai.

🤖

La CoT est la brique de base des agents IA

Les agents IA qui décomposent des tâches complexes en sous-tâches, vérifient leurs résultats et itèrent, reposent fondamentalement sur la chain of thought. Comprendre la CoT, c’est comprendre comment les agents raisonnent.

Questions fréquentes des débutants

C’est quoi la différence entre répondre directement et faire de la CoT ?▼

Sans CoT, le LLM produit directement un résultat — comme si Sofia répondait « module 4 » après un seul coup d’œil. Avec CoT, il documente chaque étape. Pour des questions simples (capitale d’un pays, conversion d’unités), la réponse directe suffit. Pour des questions complexes impliquant plusieurs niveaux de causalité, la CoT améliore significativement la précision et la cohérence.

Est-ce que ChatGPT ou Claude font de la CoT automatiquement ?▼

Les modèles dits « de raisonnement » (o1, o3, Claude avec extended thinking, DeepSeek R1) ont été entraînés pour produire une CoT interne avant de répondre. Les modèles standard ne le font que si vous demandez explicitement. La différence est importante : sans instruction CoT explicite, vous ne voyez ni ne bénéficiez du raisonnement intermédiaire.

Si l’IA montre ses étapes, est-ce que son raisonnement est forcément fiable ?▼

Non, et c’est le point critique. La chain of thought rend le raisonnement visible et auditable, pas nécessairement juste. Le LLM peut générer des étapes intermédiaires statistiquement plausibles qui mènent à une conclusion incorrecte — une forme d’hallucination structurée. La CoT vous donne les moyens de détecter l’erreur ; elle ne la supprime pas.

C’est quoi la différence entre CoT et un agent IA ?▼

La chain of thought est un mécanisme de raisonnement interne à un seul prompt. Un agent IA enchaîne plusieurs appels à un LLM, utilise des outils externes et itère sur ses résultats. Mais un agent repose presque toujours sur la CoT pour chacune de ses étapes décisionnelles. La CoT est la brique ; l’agent est le bâtiment.

Les deux articles qui ont posé les bases

Article fondateur 1✅ Vérifié — NeurIPS 2022

Wei et al. — « Chain-of-Thought Prompting Elicits Reasoning in Large Language Models »

Contexte : Publié en 2022 par des chercheurs de Google Brain, cet article est le fondateur de la technique. Wei et son équipe ont testé des prompts incluant des étapes de raisonnement intermédiaires sur des tâches d’arithmétique, de logique et de raisonnement symbolique.

Idée centrale : Montrer à un LLM des exemples de résolution pas-à-pas suffit à lui faire produire son propre raisonnement intermédiaire sur des problèmes qu’il échouerait à résoudre directement. Plus le modèle est grand, plus l’effet est spectaculaire.

Pourquoi ça a changé le domaine : Cet article a révélé que le raisonnement émergent des LLM n’était pas une propriété fixe — il pouvait être activé par la façon de formuler le prompt. Un tournant dans la compréhension du fonctionnement des transformers.

Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q. V., & Zhou, D. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems, 35, 24824–24837.

Article fondateur 2✅ Vérifié — NeurIPS 2022

Kojima et al. — « Large Language Models are Zero-Shot Reasoners »

Contexte : Publié la même année par des chercheurs de l’Université de Tokyo et Google, cet article pose une question radicale : que se passe-t-il si on ne fournit aucun exemple au modèle — juste une instruction ?

Idée centrale : En ajoutant simplement « Let’s think step by step » avant la réponse, sans aucun exemple fourni, les LLM améliorent leur précision sur des problèmes d’arithmétique de 17,7 % à 78,7 %. La recette est d’une simplicité déconcertante.

Pourquoi ça a changé le domaine : La découverte que cinq mots suffisent à transformer radicalement la qualité du raisonnement d’un LLM a eu un impact immédiat sur toutes les pratiques de prompt engineering professionnelles.

Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large language models are zero-shot reasoners. Advances in Neural Information Processing Systems, 35. arXiv:2205.11916.

3 prompts pour explorer la chain of thought

Ces prompts sont conçus pour un usage direct dans ChatGPT, Claude ou tout LLM accessible. Copiez-collez, observez, comparez.

🔭 Prompt 1 — Explorer

Un concurrent vient de lancer un nouveau produit qui cannibalise notre gamme milieu de gamme. Avant de me donner des recommandations, réfléchis étape par étape : analyse d’abord l’impact potentiel sur nos segments, puis les options stratégiques disponibles, puis les critères pour choisir entre elles.

🎯 Objectif : observer comment le LLM structure son analyse en étapes visibles | 📚 Ce qu’on apprend : voir la différence entre une réponse directe et un raisonnement CoT sur un cas managérial concret.

🧪 Prompt 2 — Tester sa compréhension

Réponds deux fois à cette question : « Si une voiture a 4 roues et qu’on retire les 2 roues avant, combien de roues reste-t-il sur l’essieu arrière ? » — Une fois directement, une fois en raisonnant étape par étape. Compare les deux réponses et explique la différence.

🎯 Objectif : constater concrètement l’effet de la CoT sur une question à piège | 📚 Ce qu’on apprend : comprendre pourquoi le raisonnement visible est plus fiable que l’association directe.

💼 Prompt 3 — Cas pratique management

Je dois décider si mon équipe adopte un nouvel outil CRM. Raisonne étape par étape : commence par identifier les critères de décision pertinents, évalue ensuite les contraintes organisationnelles, puis propose une recommandation structurée. Cite chaque étape explicitement avant de passer à la suivante.

🎯 Objectif : utiliser la CoT sur une vraie décision managériale | 📚 Ce qu’on apprend : comment transformer un LLM en conseiller structuré pour des décisions à plusieurs critères.

📚 Pour aller plus loin sur ce blog

Note méthodologique : Cet article a été rédigé avec l’assistance de Claude (Anthropic). La structure analytique, les vérifications de sources, la relecture et la validation des analogies ont été assurées par l’auteure. Les deux références académiques ont été vérifiées sur proceedings.neurips.cc et arXiv.org. Cet article fait partie du projet Concept Clash — 90 concepts IA expliqués pour les managers et les étudiants.

Cet article vous a été utile ? Partagez-le :

LinkedIn X (Twitter) Email