Les détecteurs d’IA : pourquoi ce score de 87 % ne prouve rien

Un sommelier réputé affirme reconnaître à l’aveugle, en une gorgée, si un vin sort d’une cave artisanale ou d’une cuve industrielle. On lui sert un grand cru travaillé à la main, d’une régularité parfaite. Verdict, sans hésiter : « industriel ». Le vigneron, lui, est dans la salle.

C’est très exactement ce qui se produit chaque semaine dans les universités, quand la copie d’un étudiant passe dans un détecteur d’IA.

Un détecteur d’IA, c’est quoi ?

Niveau 1 — Tout public

C’est un logiciel qui lit un texte et donne son avis : « plutôt écrit par un humain » ou « plutôt écrit par une IA ». Mais c’est un avis, pas une preuve.

Niveau 2 — Manager / Enseignant

C’est un outil statistique qui mesure des propriétés de surface du texte — sa prévisibilité, sa régularité — et en déduit une probabilité d’origine artificielle. Il ne « voit » jamais qui a écrit : il devine à partir du style.

Niveau 3 — Définition académique

Un détecteur de texte généré est un classifieur binaire qui estime la probabilité qu’une séquence textuelle provienne d’un modèle de langage, à partir de signaux statistiques (perplexité, variabilité syntaxique) ou d’un apprentissage supervisé sur des corpus étiquetés.

L’analogie du sommelier à l’aveugle

Imaginez un sommelier dont la spécialité est inhabituelle : distinguer, à l’aveugle, les vins de cave artisanale des vins de production industrielle. Il n’a accès à aucune étiquette, aucun certificat d’origine, aucune trace de la cuve. Il n’a que le verre.

Comment fait-il ? Il a goûté des milliers de bouteilles des deux familles, et il a appris à repérer des indices de texture. Les vins industriels, dit-il, sont plus lisses, plus réguliers, sans aspérité : chaque gorgée ressemble à la précédente. Les vins artisanaux ont des irrégularités, des surprises, une gorgée plus rugueuse suivie d’une gorgée plus ronde. Son palais ne détecte donc pas la provenance — il détecte une signature de régularité qui, statistiquement, accompagne souvent la production industrielle.

C’est exactement ainsi que fonctionne un détecteur d’IA. Il ne remonte jamais à l’auteur du texte : il n’existe aucun « certificat d’origine » d’une phrase. Il mesure la texture statistique de l’écriture — des mots très prévisibles, des phrases de longueur régulière, une structure sans surprise — et conclut que cette texture ressemble à celle des textes générés sur lesquels il a été entraîné.

Vous voyez immédiatement les deux accidents possibles. Premier accident : un vigneron méticuleux produit un vin artisanal d’une régularité parfaite — le sommelier le classe « industriel ». C’est le faux positif : l’étudiant sérieux, qui écrit comme on le lui a appris (plan rigoureux, phrases équilibrées, vocabulaire attendu), produit précisément la texture que le détecteur associe à l’IA. Second accident : un industriel habile introduit volontairement quelques irrégularités dans sa cuvée — le sommelier la classe « artisanale ». C’est le faux négatif : un texte généré puis légèrement retouché retrouve une texture « humaine » et passe sous le radar.

Les limites de cette image. Notre sommelier goûte avec un palais humain, de l’expérience et du doute ; le détecteur, lui, calcule une probabilité sans jamais accéder au sens du texte, et il l’affiche avec une fausse précision (« 87 % IA ») qu’aucun sommelier honnête ne revendiquerait. Surtout, le vin garde des traces physiques de sa fabrication ; un texte, lui, n’en garde aucune. C’est ce qui rend le problème de détection structurellement plus difficile que la dégustation.

Sous le capot : quatre notions traduites

Notion technique Dans notre analogie du sommelier En réalité (sans jargon)
Perplexité La « rondeur » du vin : trop lisse, sans aspérité, donc suspect Mesure à quel point chaque mot est prévisible. Un texte fait de mots attendus obtient une perplexité basse — et un verdict « IA »
Variabilité (burstiness) La régularité d’une gorgée à l’autre L’alternance de phrases courtes et longues. L’écriture humaine spontanée alterne ; l’écriture générée — et l’écriture académique normée — lissent
Classifieur entraîné La formation du sommelier sur des bouteilles déjà étiquetées Un modèle qui a appris sur des exemples « humain » / « IA ». Il hérite des angles morts de ses exemples : nouveaux modèles, autres langues, styles atypiques
Score de probabilité Le verdict « industriel à 87 % » lancé sans certificat à l’appui Une estimation statistique présentée comme une mesure. Aucun seuil (60 % ? 90 % ?) n’a de validité scientifique établie pour fonder une accusation

Ce que ça change pour vous

Si vous enseignez : ne fondez jamais une accusation sur un score. La recherche a montré que les détecteurs se trompent massivement sur certains profils. Liang et ses collègues (Stanford, 2023) ont constaté que plus de la moitié des essais TOEFL rédigés par des non-anglophones étaient classés « générés par IA », alors que les mêmes outils étaient quasi parfaits sur des copies d’élèves américains natifs. Ce sont vos étudiants internationaux, et vos étudiants les plus scolaires, qui seront accusés en premier.

Si vous évaluez : déplacez la preuve vers ce que l’IA ne peut pas faire à la place de l’étudiant. Cinq minutes de soutenance orale sur sa propre copie, l’historique des versions d’un document, un journal de bord du travail : chacun de ces dispositifs est plus discriminant qu’un logiciel, et aucun ne produit de fausse accusation.

Si vous managez : ne filtrez ni candidatures ni contenus avec ces outils. Écarter une lettre de motivation ou un texte de prestataire sur la foi d’un score de détection vous expose au même taux d’erreur — avec, en prime, un risque juridique si la décision est contestée.

Dans tous les cas : exigez la transparence plutôt que la traque. Demander à un étudiant ou à un collaborateur de documenter son usage de l’IA (qu’a-t-il demandé, qu’a-t-il gardé, qu’a-t-il vérifié) est plus formateur et plus fiable que de jouer au gendarme avec un radar qui flashe au hasard. Le fabricant de ChatGPT lui-même a retiré son propre détecteur en 2023, six mois après son lancement, pour cause de précision insuffisante : quand le constructeur renonce à reconnaître sa propre production, le débat sur la fiabilité est clos.

FAQ — Les questions que tout le monde se pose

Mais l’outil affiche un pourcentage précis, c’est bien qu’il mesure quelque chose ?
Il mesure bien quelque chose : la ressemblance statistique de votre texte avec les textes générés de son corpus d’entraînement. Le problème est l’interprétation. « 87 % IA » ne signifie pas « 87 % de chances que ce texte soit frauduleux » — beaucoup de textes humains parfaitement honnêtes présentent cette même texture. La précision affichée du chiffre masque l’imprécision de ce qu’il représente.
Pourquoi mon texte 100 % personnel est-il détecté comme IA ?
Parce que vous écrivez probablement « bien » au sens scolaire : plan rigoureux, phrases équilibrées, vocabulaire attendu, transitions classiques. Cette régularité est précisément la texture que les détecteurs associent à l’IA. C’est le paradoxe central : l’écriture académique normée, celle qu’on enseigne depuis des décennies, est le style le plus souvent classé comme artificiel. Les rédacteurs non natifs, dont le vocabulaire est statistiquement plus prévisible, sont les plus touchés.
Il existe quand même un détecteur plus fiable que les autres, non ?
L’étude européenne de référence (Weber-Wulff et al., 2023) a testé quatorze outils, dont les plus connus du marché. Conclusion : aucun n’atteint une fiabilité suffisante pour un usage disciplinaire, et la précision de tous s’effondre dès que le texte généré est paraphrasé ou légèrement modifié. Les écarts entre outils existent, mais ils se jouent entre « peu fiable » et « très peu fiable ».
Et si on croisait plusieurs détecteurs pour être sûr ?
L’intuition est bonne, le résultat décevant : les détecteurs partagent les mêmes principes (perplexité, régularité), donc les mêmes angles morts. Ils se trompent souvent ensemble, et quand ils divergent, vous n’avez aucun critère pour savoir lequel croire. Croiser deux thermomètres cassés ne donne pas la température.
Comment prouver que j’ai écrit mon texte moi-même ?
Par le processus, pas par le produit. Conservez l’historique des versions (Google Docs et Word l’enregistrent automatiquement), vos brouillons, vos notes de lecture. En cas de contestation, cette traçabilité du travail vaut infiniment plus que n’importe quel contre-score. Et si vous êtes évalué : proposez de défendre votre copie à l’oral — c’est la meilleure preuve qui existe.

Deux articles fondateurs pour aller plus loin

1. Le biais contre les non-anglophones

Publié à l’été 2023 par une équipe de Stanford, au moment où les universités américaines s’équipaient massivement en détecteurs. L’idée centrale : ces outils jugent un texte « humain » quand son vocabulaire est riche et imprévisible. Or les rédacteurs non natifs écrivent, par définition, avec un lexique plus restreint — leur écriture honnête a la texture statistique d’un texte généré. L’étude a transformé le débat : la détection n’est plus seulement un problème technique, c’est un problème d’équité.

Liang, W., Yuksekgonul, M., Mao, Y., Wu, E., & Zou, J. (2023). GPT detectors are biased against non-native English writers. Patterns, 4(7), 100779. https://doi.org/10.1016/j.patter.2023.100779

2. Le test grandeur nature des outils du marché

Une équipe européenne de huit chercheurs spécialistes de l’intégrité académique a soumis quatorze détecteurs à un protocole rigoureux : textes humains, textes générés, textes traduits, textes paraphrasés. L’idée centrale : évaluer les outils non pas dans les conditions idéales de leurs éditeurs, mais dans les conditions réelles d’une fraude. Le résultat — aucun outil fiable, et une précision qui s’effondre à la moindre modification du texte — est devenu la référence citée dans les débats institutionnels sur l’usage disciplinaire de ces logiciels.

Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P., & Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19, 26. https://doi.org/10.1007/s40979-023-00146-z

Trois prompts pour explorer le sujet avec un LLM

Prompt 1 — Explorer

Explique-moi ce qu’est la perplexité d’un texte, avec un exemple de phrase à perplexité basse et un exemple à perplexité haute. Puis dis-moi pourquoi cette mesure ne permet pas de prouver qu’un texte a été écrit par une IA.

🎯 Objectif : comprendre la mécanique centrale des détecteurs | 📚 Ce qu’on apprend : la différence entre « mesurer une propriété du texte » et « identifier son auteur »

Prompt 2 — Tester sa compréhension

Je pense avoir compris pourquoi les détecteurs d’IA produisent des faux positifs. Pose-moi 5 questions pour vérifier ma compréhension, une par une, et corrige mes réponses.

🎯 Objectif : auto-évaluation active | 📚 Ce qu’on apprend : repérer ses propres confusions entre corrélation statistique et preuve

Prompt 3 — Cas pratique management

Je dirige une équipe pédagogique. Aide-moi à rédiger une politique d’évaluation en 5 points qui prend acte du fait que les détecteurs d’IA ne sont pas fiables, sans pour autant renoncer à l’intégrité académique.

🎯 Objectif : passer du constat à la décision | 📚 Ce qu’on apprend : concevoir des dispositifs d’évaluation robustes à l’IA plutôt que des dispositifs de surveillance

Note méthodologique. Cet article a été rédigé avec l’assistance d’une IA générative (Claude, Anthropic), selon un gabarit éditorial conçu par l’auteure : structuration analogique, vérification systématique des références citées (les deux articles fondateurs ont été contrôlés via leurs DOI), relecture et validation humaines. Cohérence avec le sujet oblige : c’est le processus documenté, pas un score de détection, qui atteste de la méthode.

Suivre le blog

Sans newsletter qui monétise vos données.

📡 RSS 📖 WP LinkedIn → S’abonner

En savoir plus sur Maria Mercanti-Guérin

Abonnez-vous pour poursuivre la lecture et avoir accès à l’ensemble des archives.

Poursuivre la lecture