🔍 Bullshit Détecteur — Mai 2026 | lecture ~10 min
« L’IA hallucine » : le mot qui empêche de voir ce qui se passe vraiment
Depuis 2022, un mot s’est imposé dans tous les discours sur l’IA générative : hallucination. L’IA hallucine. Elle invente des faits. Elle fabrique des références qui n’existent pas. Elle confond des dates, des noms, des chiffres. Et chaque nouveau modèle est présenté comme halluccinant moins que le précédent. Progrès mesuré, problème en voie de résolution.
Ce cadrage est un problème. Pas parce qu’il est faux — les LLM produisent bien des sorties incorrectes. Mais parce qu’il décrit mal ce qui se passe. Et mal décrire un phénomène, c’est se condamner à mal le gérer.
Le discours ambiant (celui qu’on va décortiquer)
Voici les formulations que vous lisez partout :
- « GPT-5 hallucine deux fois moins que GPT-4 — la fiabilité progresse »
- « Évitez de demander à l’IA des informations factuelles, elle peut halluciner »
- « Le RAG résout le problème des hallucinations »
- « L’IA a menti sur ce point — vérifiez toujours ses sources »
- « Les détecteurs d’IA permettent d’identifier les contenus faux »
Derrière chacune de ces formulations : une intuition juste sur le symptôme, et un diagnostic faux sur la cause. Prenons-les un par un.
Anatomie de cinq affirmations — ce qu’on dit vs ce qui est
CE QU’ON DIT
🔬 « L’IA hallucine »
Dit : Quand l’IA se trompe, elle « hallucine » — comme un cerveau qui perçoit quelque chose qui n’est pas là. C’est une erreur accidentelle, un dysfonctionnement ponctuel par rapport à une norme de vérité que le système rechercherait ordinairement.
CE QUI EST
Le terme « hallucination » est une métaphore médicale importée sans justification. Un LLM n’a pas de perception. Il prédit le token suivant le plus probable à partir de son entraînement. Il ne cherche pas la vérité pour ensuite s’en écarter — il ne l’a jamais cherchée. La métaphore suggère un écart pathologique. C’est le fonctionnement normal du système qu’elle décrit.
CE QU’ON DIT
📉 « Les nouveaux modèles hallucinent moins »
Dit : Les benchmarks montrent une réduction des taux d’hallucination. Le problème est en voie de résolution par l’amélioration technique des modèles.
CE QUI EST
Les modèles récents produisent un bullshit plus convaincant, pas structurellement moins fréquent. Ils habillent leurs sorties incorrectes avec des formulations plus fluides, des sources plus vraisemblables, des chiffres plus plausibles. Ce qui diminue, c’est la détectabilité de l’erreur — pas son occurrence. Un bullshit indétectable est plus dangereux qu’un bullshit grossier.
CE QU’ON DIT
🗄️ « Le RAG résout le problème »
Dit : Le Retrieval-Augmented Generation force le modèle à s’appuyer sur des documents vérifiés avant de répondre. Problème réglé.
PARTIELLEMENT VRAI — MAIS
Le RAG réduit le bullshit dans le périmètre documentaire fourni. Il ne l’élimine pas : le modèle peut toujours mal interpréter un document, confondre deux passages, synthétiser de façon créative des sources contradictoires. Et pour tout ce qui dépasse la base documentaire — synthèse, inférence, raisonnement — l’indifférence structurelle à la vérité reste intacte. Le RAG est un garde-fou, pas un remède.
CE QU’ON DIT
🤥 « L’IA a menti »
Dit : Quand un LLM donne une information fausse, il « ment ». Il faut vérifier ses sources comme on vérifierait celles d’un collaborateur peu fiable.
CE QUI EST
Le mensonge suppose une intention de tromper et une connaissance de la vérité cachée. Frankfurt (2005) l’a formalisé : le menteur respecte la vérité en négatif — il sait ce qu’elle est et choisit de la dissimuler. Un LLM n’a ni intention, ni accès à la vérité. Il produit de la plausibilité. Ce n’est pas un menteur — c’est un bullshitteur au sens philosophique strict. La conséquence pratique est majeure : face à un menteur, vous pouvez reconstituer la vérité cachée. Face à du bullshit, il n’y a rien à reconstituer — il n’y a que du vide habillé.
CE QU’ON DIT
🔍 « Les détecteurs d’IA repèrent les contenus faux »
Dit : Des outils comme Turnitin ou GPTZero permettent d’identifier les textes générés par IA — et donc de filtrer le bullshit.
CE QUI EST
Les détecteurs d’IA ne détectent pas le faux — ils détectent la probabilité statistique qu’un texte soit d’origine non-humaine. Ce sont deux choses différentes. Un texte vrai peut être détecté comme IA ; un texte faux écrit par un humain passe le filtre. Pire : un essai français vieux d’un siècle a été évalué à plus de 60 % de contenu IA par certains outils. Le ministère chinois des Sciences et Technologies a qualifié ces dispositifs de « superstition technologique ». C’est sévère — et pas totalement faux.
L’angle mort : ce que « bullshit » dit que « hallucination » tait
En 2024, trois philosophes britanniques publient dans Ethics and Information Technology un article au titre délibérément inconfortable : ChatGPT is bullshit. Leur argument est précis.
Ils s’appuient sur le cadre de Harry Frankfurt — philosophe américain dont l’essai On Bullshit (1986, republié en 2005) est devenu une référence dans la philosophie du langage. Frankfurt distingue trois postures face à la vérité :
| Posture | Rapport à la vérité | Intention |
|---|---|---|
| La vérité | La cherche, la dit | Informer correctement |
| Le mensonge | La connaît, la dissimule | Tromper délibérément |
| Le bullshit | S’en désintéresse totalement | Produire un effet (convaincre, paraître) |
Le bullshitteur n’est pas un menteur raté. C’est quelqu’un dont l’objectif est orthogonal à la vérité : il produit des énoncés qui fonctionnent socialement — qui convainquent, qui impressionnent, qui meublent — sans que leur valeur de vérité entre en ligne de compte. Ce n’est pas un dysfonctionnement. C’est sa fonction.
Hicks, Humphries & Slater appliquent ce cadre aux LLM avec une précision chirurgicale. Un grand modèle de langage produit des tokens à partir de distributions de probabilité sur son corpus d’entraînement. Il n’a aucun accès à la réalité extérieure. Il n’a aucun mécanisme de vérification intégré. Il optimise pour la cohérence et la fluidité du texte produit — pas pour sa correspondance avec les faits. Il répond à la définition du bullshitteur selon Frankfurt : indifférence constitutive à la vérité.
📌 Pourquoi cette distinction change tout en pratique
Face à un menteur, vous pouvez chercher les motivations et reconstituer la vérité cachée. Face à du bullshit, il n’y a rien à reconstituer — il n’existe pas de vérité sous-jacente que le modèle dissimulerait. Demander à un LLM de vérifier ses propres affirmations revient à demander à quelqu’un qui improvise s’il improvise : il va produire une réponse convaincante à cette question aussi.
Pourquoi « hallucination » est lui-même du bullshit institutionnel
Ce n’est pas une question de vocabulaire académique. Le choix du terme « hallucination » a des effets réels et mesurables sur la façon dont les organisations déploient l’IA.
Premier effet : il localise le problème. Une « hallucination » est un accident ponctuel dans un système globalement fiable. Le bullshit est le mode de fonctionnement ordinaire. Si vous pensez que le problème est localisé, vous mettez des filets à certains endroits. Si vous comprenez que le problème est structurel, vous revoyez l’architecture de la confiance.
Deuxième effet : il oriente vers de mauvaises solutions. Pour réduire les hallucinations, on améliore le modèle, on augmente le contexte, on affine l’entraînement. Pour réduire le bullshit, on change le périmètre des tâches confiées. Ce ne sont pas les mêmes interventions.
Troisième effet : il dédouane. Une hallucination, c’est une erreur technique. Un système qui bullshitte structurellement engage la responsabilité de ceux qui le déploient pour des tâches à enjeux factuels. Le vocabulaire de la pathologie accidentelle protège les développeurs. Le vocabulaire du dysfonctionnement structurel les expose.
Luciano Floridi, philosophe de l’information, l’a formulé autrement dans Philosophy & Technology en 2023 : les LLM sont de l’ « agentivité sans intelligence ». Ils font des choses — produire du texte, répondre à des questions, rédiger des analyses — sans rien comprendre au sens que ces choses ont. L’indifférence à la vérité de Frankfurt et l’absence d’intelligence de Floridi pointent le même phénomène par deux chemins différents.
Ce que ça change concrètement
Si vous utilisez l’IA pour produire des documents professionnels : la plausibilité d’une sortie ne dit rien sur sa vérité. Un rapport IA parfaitement structuré, fluide, bien sourcé en apparence peut être factuellement faux de bout en bout. La relecture humaine n’est pas une précaution supplémentaire — c’est la condition de base de l’utilisation.
Si vous formez des étudiants à l’utilisation de l’IA : enseigner à « vérifier les hallucinations » entretient une représentation erronée. Ce qu’il faut enseigner : quelles tâches sont bullshit-safe (reformulation, génération d’idées, structuration) et quelles tâches sont bullshit-risquées (chiffres, dates, noms, citations, références légales). La ligne de partage n’est pas entre tâches simples et complexes — elle est entre tâches où la plausibilité suffit et tâches où la vérité est indispensable. C’est là que l’IA peut être un outil de travail puissant — et une source de fiabilité accrue — quand on comprend ce qu’elle fait vraiment. Voir aussi les ressources sur l’intégration de l’IA dans la recherche et les mémoires de master.
Si vous êtes responsable de la gouvernance IA dans une organisation : les politiques qui se concentrent sur la détection des hallucinations résolvent le mauvais problème. La question pertinente n’est pas « comment repère-t-on quand l’IA se trompe ? » — c’est « pour quelles décisions peut-on accepter une source structurellement indifférente à la vérité ? »
⚖️ Verdict — Bullshit-o-mètre
« L’IA hallucine » : bullshit de confort
Le terme « hallucination » n’est pas faux — il désigne bien quelque chose de réel. Mais il le désigne de la mauvaise façon, avec les mauvaises implications. Il localise ce qui est diffus. Il accidentalise ce qui est structurel. Il pathologise ce qui est fonctionnel. Et, accessoirement, il protège les acteurs qui ont intérêt à ce que le problème semble résolu par la prochaine version du modèle.
Le terme « bullshit » au sens de Frankfurt est inconfortable. Il ne passe pas bien dans les communiqués de presse. Il froisse. Mais il décrit avec précision ce qui se passe : un système qui produit de la plausibilité sans rapport à la vérité, avec constance et fluidité, quel que soit le sujet.
La vraie question n’est pas « comment empêcher l’IA de se tromper ? » — c’est : pour quelles décisions sommes-nous prêts à confier la production de contenu à un système structurellement indifférent à la vérité ? Tant que cette question reste mal posée, les réponses resteront mal calibrées.
📎 Pour aller plus loin sur ce site
Mémoire de master et IA — intégrer l’IA dans sa recherche sans bullshitter son jury
50 concepts clés de l’IA générative — guide pédagogique pour managers et étudiants
Outils pédagogiques et recherche — ressources Master et MAE
📌 Sources : Frankfurt, H. G. (2005). On Bullshit. Princeton University Press ✅ · Hicks, M. T., Humphries, J., & Slater, J. (2024). ChatGPT is bullshit. Ethics and Information Technology, 26(2). https://doi.org/10.1007/s10676-024-09775-5 ✅ · Floridi, L. (2023). AI as agency without intelligence. Philosophy & Technology, 36, 15. https://doi.org/10.1007/s13347-023-00621-y ✅ · Cet article a été rédigé avec l’assistance de Claude (Anthropic). Les références ont été vérifiées manuellement. Les positions exprimées sont celles de l’autrice.
📤 Partager cet article













Laisser un commentaire