Qu’est-ce qui rend un texte humain ? 7 signaux que l’IA ne peut toujours pas imiter

Vous pouvez repérer un texte d’IA en quelques secondes. Pas à cause de ce qu’il dit — mais à cause de ce qu’il ne fait pas mal.

Lisez n’importe quel paragraphe généré par un grand modèle de langage et quelque chose semble étrange. La grammaire est irréprochable. La ponctuation est parfaite. Chaque phrase suit un rythme prévisible. Il n’y a pas une seule faute de frappe, pas une virgule égarée, pas de phrase interminable, pas un moment où l’écriture trébuche ou se corrige en pleine pensée. Le texte est poli à un degré inquiétant, et c’est précisément ce polissage qui le trahit.

L’écriture humaine se définit autant par ses imperfections que par son contenu. Nous oublions des virgules. Nous abusons de certains mots. Nous commençons des phrases par « Et » ou « Mais ». Nous faisons des erreurs de frappe liées à la physique qui suivent la géométrie de nos claviers. Ce ne sont pas des défauts à corriger. C’est l’empreinte digitale d’un esprit humain travaillant avec le langage en temps réel, et leur absence est le marqueur le plus clair qu’une machine a produit le texte.

Cet article examine les sept signaux qui rendent un texte humain — et explique pourquoi l’un d’entre eux, les fautes de frappe, est à la fois le signal le plus fort et le plus difficile à reproduire de manière convaincante par l’IA.

Les 7 signaux de l’écriture humaine

1. Fautes de frappe et erreurs de clavier

C’est le signal le plus puissant d’une écriture humaine, et celui que l’IA rate le plus systématiquement. Quand les humains tapent, leurs doigts interagissent avec des touches physiques sur des appareils physiques. Un léger décalage vers la gauche transforme « the » en « thr » parce que le « e » et le « r » sont adjacents sur un clavier QWERTY. Un pouce pressé sur l’écran tactile d’un téléphone rate la barre d’espace et produit « thequick. » Un moment de fatigue double une frappe : « keyboaard. »

Ces erreurs ne sont pas aléatoires. Elles suivent les lois de la physique — proximité des touches, portée des doigts, rayon de toucher de l’appareil, vitesse de frappe. Les vraies fautes de frappe sont prévisibles dans leur distribution même quand elles sont imprévisibles dans leur position exacte. Cela les rend extrêmement difficiles à falsifier de manière convaincante. L’insertion aléatoire de caractères produit des erreurs qu’aucune main humaine ne ferait jamais, et les lecteurs détectent la différence inconsciemment. Nous reviendrons en détail sur ce signal plus loin dans l’article, car c’est celui qui compte le plus pour quiconque cherche à rendre un texte authentiquement humain.

2. Mise en forme incohérente

Les humains sont terribles en matière de cohérence. Nous oublions les points à la fin des éléments d’une liste. Nous mettons des majuscules de façon incohérente. Nous utilisons un tiret cadratin dans un paragraphe et un trait d’union entouré d’espaces dans le suivant. Nous mélangeons les contractions et les formes complètes dans le même paragraphe, non pas par effet stylistique mais parce que nous pensons à ce que nous voulons dire, pas à la façon dont nous le formatons.

Le texte généré par l’IA ne fait presque jamais d’erreurs de mise en forme. Chaque liste est stylisée de manière identique. Chaque signe de ponctuation est correct. Chaque phrase se termine par un point. Cette cohérence mécanique est l’une des premières choses qui déclenchent la réaction « ceci a été écrit par une machine » chez les lecteurs expérimentés.

3. Variation de la longueur des phrases

Lisez n’importe quel paragraphe généré par l’IA et mesurez la longueur des phrases. Elles tendent à se regrouper dans une bande étroite — généralement entre 15 et 25 mots, avec remarquablement peu de variation. Le rythme est métronomique.

L’écriture humaine oscille énormément. Une longue phrase sinueuse qui explore plusieurs idées en un seul souffle est suivie d’un fragment. Puis une question. Puis quelque chose de longueur moyenne. Puis encore une longue. La variation n’est pas aléatoire — elle reflète le processus de pensée de l’auteur, son emphase, sa respiration.

Gary Provost l’a démontré de manière célèbre : « This sentence has five words. Here are five more words. Five-word sentences are fine. But several together become monotonous. Listen to what is happening. The writing is getting boring. The sound of it drones. It’s like a stuck record. » Puis il brise le schéma avec une longue phrase fluide, et le texte prend vie. L’IA a tendance à rester dans la gamme médiane, produisant un texte qui se lit facilement mais ne respire jamais.

4. Mots de remplissage et hésitations

Les humains hésitent constamment. Nous écrivons « je pense », « en quelque sorte », « probablement », « un peu », « on dirait que » et « d’une certaine manière ». Nous utilisons des marqueurs discursifs comme « bon », « alors », « bref » et « en fait ». Ces mots portent peu de contenu sémantique mais une énorme information sociale. Ils signalent que l’auteur est une personne avec de l’incertitude, une perspective, une relation avec le lecteur.

Le texte d’IA a tendance à être soit déclaratif avec assurance, soit à hésiter de manière convenue (« Il est important de noter que... »). L’hésitation organique et naturelle qui imprègne la communication humaine réelle — où quelqu’un écrit « je suppose » non pas parce qu’il est incertain mais parce qu’il veut atténuer une affirmation forte — est quelque chose que les modèles de langage peinent à reproduire de manière authentique.

5. Argot contextuel et mauvais usage des expressions idiomatiques

Les humains utilisent l’argot de façon imprécise. Nous estropions les expressions idiomatiques. Nous disons « I could care less » quand nous voulons dire le contraire. Nous écrivons « for all intensive purposes » au lieu de « for all intents and purposes ». Nous utilisons des expressions régionales qui ne fonctionnent que dans des communautés spécifiques, et nous les employons parfois légèrement mal, ce qui paradoxalement les rend plus authentiques.

Les modèles d’IA ont appris les formes correctes des expressions idiomatiques à partir d’énormes corpus d’entraînement. Ils se trompent rarement sur une expression, ce qui, ironiquement, rend leur usage stérile. Un humain qui écrit « it’s a doggy dog world » sonne plus authentiquement humain qu’une IA qui écrit correctement « it’s a dog-eat-dog world ».

6. Changements de ton émotionnel

L’écriture humaine change de registre émotionnel au sein d’un même texte. Un email professionnel peut commencer formellement, se réchauffer au milieu avec une blague ou une remarque personnelle, puis se terminer sur un ton complètement différent. Un article de blog peut osciller entre l’analytique, le frustré et l’amusé en quelques paragraphes. Ces changements reflètent des états émotionnels authentiques qui évoluent à mesure que l’auteur travaille ses idées.

L’IA a tendance à maintenir un ton émotionnel cohérent tout au long du texte. Si elle commence de manière professionnelle, elle reste professionnelle. Si elle commence de manière décontractée, chaque paragraphe reste aussi décontracté. Le tracné plat émotionnel est subtil mais perceptible, surtout dans les textes plus longs où un véritable auteur humain laisserait inévitablement son humeur colorer la prose.

7. Structure imparfaite

Le texte d’IA adore la structure. Introduction, trois paragraphes principaux avec des phrases thématiques, conclusion avec une reformulation de la thèse. Chaque section fait approximativement la même longueur. Chaque argument suit une progression logique.

Les humains écrivent de façon désordonnée. Nous partons en digressions. Nous revenons à un point fait trois paragraphes plus tôt. Nous consacrons la moitié de l’article à la partie qui nous intéresse et survolons le reste. Nous terminons parfois abruptement parce que nous avons dit ce que nous voulions dire. Nous cassons nos propres plans. Le désordre n’est pas un défaut — c’est un signal qu’un esprit humain naviguait parmi les idées en temps réel, au lieu d’exécuter un modèle précalculé.

Pourquoi les fautes de frappe sont le signal le plus difficile à imiter

Parmi les sept signaux ci-dessus, les fautes de frappe occupent une position unique. Elles sont le marqueur le plus fort de l’écriture humaine et le plus difficile à reproduire de manière convaincante. Voici pourquoi.

La plupart des approches pour ajouter des erreurs au texte utilisent la mutation aléatoire de caractères : choisir une position, choisir un caractère de remplacement dans l’alphabet et permuter. Le résultat est du texte avec des erreurs, mais pas du texte avec des erreurs humaines. « keyboard » devient « keybxard » ou « keyb*ard ». Aucun humain ne tape comme ça. Un humain produirait « keybiard » (touche adjacente pressée sur une disposition QWERTY), « keybard » (caractère omis) ou « keybaord » (paire transposée).

La différence, c’est la physique. Quand votre doigt dévie, il dévie vers une touche voisine, pas vers un emplacement aléatoire du clavier. La probabilité de frapper une touche incorrecte donnée est une fonction de la distance physique par rapport à la cible visée. Cela signifie que les vraies erreurs de frappe portent une signature — un schéma statistique que les lecteurs ont intériorisé au cours de toute une vie à voir (et à faire) des fautes de frappe. Quand le schéma est faux, les erreurs semblent synthétiques même si le lecteur ne peut pas expliquer pourquoi.

La recherche derrière les erreurs basées sur la physique

Ce n’est pas de la spéculation. Une recherche de la conférence CHI 2025 (Shi et al., « Simulating Errors in Touchscreen Typing ») a développé des modèles informatiques d’erreurs de frappe sur écran tactile basés sur le bruit du contrôle moteur. Leurs résultats confirment que les erreurs de frappe sont gouvernées par des facteurs physiques : bruit de position des doigts, proximité des touches, taille de la zone de toucher de l’appareil et contraintes biomécaniques du mouvement de la main.

Des travaux antérieurs de Dhakal et al. (2018), analysant plus de 136 millions de frappes de 168 000 volontaires, ont identifié des groupes distincts de dactylographes avec différentes distributions d’erreurs. Les dactylographes rapides utilisent plus de doigts et font des types d’erreurs différents des dactylographes lents. Les erreurs ne sont pas aléatoires — elles sont systématiques, et le système, c’est la physique.

Le type d’appareil compte énormément. Les écrans tactiles de téléphone ont un rayon de frappe de touche adjacente plus large que les claviers physiques, car un pouce couvre plus de surface de touche qu’un bout de doigt. Les claviers de tablette produisent un niveau intermédiaire d’erreurs. La saisie par glissement introduit des modes de défaillance entièrement différents. Le même dactylographe fait des erreurs fondamentalement différentes sur différents appareils, et ces schémas spécifiques à l’appareil sont quelque chose que les lecteurs reconnaissent instinctivement.

Pourquoi le bruit aléatoire échoue

Ajouter des erreurs de caractères aléatoires au texte d’IA le rend en fait plus détectable, pas moins. Les algorithmes d’autocorrection, les correcteurs orthographiques et même les lecteurs occasionnels sont calibrés pour s’attendre à des schémas d’erreur basés sur la physique. Quand les erreurs ne suivent pas ces schémas, le texte sonne faux d’une manière qui est pire que de n’avoir aucune erreur du tout. On est passé de « trop parfait » à « mauvais type d’imperfection », et le second est plus déconcertant.

Pour simuler de manière convaincante les erreurs de frappe humaines, il faut un modèle qui comprend la géométrie du clavier, l’adjacence des touches, les zones de toucher spécifiques à l’appareil et les distributions de probabilité des différents types d’erreurs (frappes de touches adjacentes, transpositions, omissions, caractères doublés, erreurs d’espacement, erreurs de ponctuation). Il faut des erreurs qui reposent sur la façon dont les doigts interagissent réellement avec les appareils de saisie.

Ce que cela signifie pour les créateurs de contenu

Si vous utilisez l’IA pour vous aider à écrire — et la plupart des créateurs de contenu le font désormais — le défi n’est pas de générer un bon texte. Le défi est de faire en sorte que ce texte semble provenir d’une personne. Les sept signaux ci-dessus sont une feuille de route pour comprendre ce que « humain » signifie dans le contexte du texte écrit.

Certains de ces signaux relèvent du savoir-faire. Vous pouvez vous entraîner à varier la longueur des phrases, à utiliser les hésitations naturellement, à casser la structure intentionnellement et à changer de ton. Ce sont des compétences rédactionnelles qui complètent l’assistance de l’IA.

Mais les fautes de frappe sont différentes. Ce n’est pas une compétence rédactionnelle — c’est un artefact physique du processus de frappe. Vous ne pouvez pas simplement parsemer un texte poli d’erreurs aléatoires et espérer qu’il semble authentique. Les erreurs doivent suivre les mêmes schémas basés sur la physique que produit la frappe réelle. Elles doivent respecter la disposition du clavier, le type d’appareil et les contraintes biomécaniques des mains humaines.

C’est exactement ce que fait LikelyTypo. C’est un outil web qui génère des fautes de frappe réalistes en modélisant l’acte physique d’appuyer sur des touches. Au lieu de la mutation aléatoire de caractères, il utilise des cartes d’adjacence de clavier, des modèles de toucher spécifiques à l’appareil et des profils de frappe pour produire des erreurs qui semblent provenir d’une vraie personne sur un vrai appareil. Vous pouvez coller n’importe quel texte, sélectionner un appareil et un profil de frappe, et voir instantanément à quoi ressemblerait ce texte avec des fautes de frappe humaines authentiques — du type qui suit la physique, pas le hasard.

Authenticité, pas tromperie

L’objectif n’est pas de tromper qui que ce soit. L’objectif est l’authenticité. Quand vous écrivez une réponse de chatbot qui inclut une faute de frappe subtile, elle semble plus humaine — non pas parce que vous trompez l’utilisateur, mais parce que vous reconnaissez que la communication réelle est imparfaite. Quand vous remplissez une démo d’interface avec du texte qui inclut des erreurs réalistes, la démo ressemble davantage à une vraie application. Quand vous testez votre système d’autocorrection avec des fautes de frappe basées sur la physique, vos tests reflètent ce que les vrais utilisateurs taperont.

L’imperfection n’est pas un défaut à ajouter cyniquement. C’est une dimension de la communication humaine qui a été accidentellement effacée par l’IA, et la restaurer est une question de savoir-faire honnête.

Essayez par vous-même

Le moyen le plus rapide de comprendre ce qui rend un texte humain est de voir la différence entre des erreurs aléatoires et des erreurs basées sur la physique. Ouvrez la vitrine interactive de LikelyTypo, collez un paragraphe de texte généré par l’IA et générez des fautes de frappe avec les paramètres par défaut. Regardez les erreurs qui apparaissent. Ce seront des frappes de touches adjacentes, des transpositions, des caractères omis, des erreurs d’espacement — les mêmes types d’erreurs que vous faites chaque jour en tapant rapidement. Maintenant, imaginez le même texte avec des substitutions aléatoires de caractères : « thx quicj broen fox. » L’un semble humain. L’autre ressemble à de la corruption de données.

Essayez de changer de type d’appareil pour voir comment les erreurs changent. La frappe sur téléphone produit des schémas différents de ceux d’un clavier physique. Essayez différents profils de frappe — subtil pour du contenu professionnel, frappe-rapide pour les messages décontractés. Chaque combinaison produit un ensemble d’erreurs différent mais toujours plausible, car chacun repose sur la physique de la façon dont les gens tapent réellement sur cet appareil.

Découvrez à quoi ressemblent les fautes de frappe réalistes

Collez n’importe quel texte et voyez instantanément des fautes de frappe basées sur la physique. Changez d’appareil, de profil et de disposition pour voir comment les schémas d’erreur changent.

Essayer la vitrine interactive

L’IA écrit parfaitement. Les humains non. La différence n’est pas un problème à résoudre — c’est un signal à comprendre. Et parmi tous les signaux qui rendent un texte humain, les fautes de frappe sont les plus puissantes, les plus ancrées dans la physique et les plus susceptibles d’être restaurées de manière authentique.