La plupart des gens pensent qu’une faute de frappe se résume à appuyer sur la mauvaise touche. Mais les erreurs de frappe sont bien plus variées et intéressantes qu’une simple substitution de caractères. Elles couvrent de nombreuses catégories, chacune avec sa propre cause physique, sa propre fréquence et sa propre empreinte dans le texte résultant.

Comprendre ces catégories est important pour quiconque travaille avec la génération de texte réaliste, l’évaluation de l’autocorrection, les tests d’expérience utilisateur, ou même l’écriture créative. Un outil qui ne produit qu’un seul type d’erreur—la substitution aléatoire de caractères—passe à côté de l’image complète de la façon dont les humains font réellement des fautes de frappe. Les erreurs de frappe réelles suivent une taxonomie ancrée dans la biomécanique, la physique du clavier et la charge cognitive liée à la traduction des pensées en frappes de touches.

Erreurs de caractères

Les erreurs au niveau des caractères sont la catégorie la plus courante. Elles impliquent des caractères individuels erronés, manquants ou superflus. Chaque sous-type a une cause physique distincte.

Touche adjacente

L’erreur de frappe la plus fréquente. Le doigt dérive légèrement et atterrit sur une touche voisine au lieu de celle visée. “the” devient “thr” parce que “e” et “r” sont adjacents sur un clavier QWERTY. “was” devient “wss” parce que “a” et “s” sont côte à côte.

Les erreurs de touche adjacente sont déterminées par le bruit du contrôle moteur—l’imprécision inhérente à la façon dont le système nerveux dirige le mouvement des doigts. La probabilité de frapper une touche incorrecte donnée est une fonction de la distance physique par rapport à la cible. C’est pourquoi les erreurs de touche adjacente dominent largement tous les autres types d’erreurs.

Confusion de main

Les doigts frappent la position miroir sur la main opposée. Au lieu d’appuyer sur “f” avec l’index gauche, l’index droit s’active et frappe “j”—la même position du doigt, main opposée. Cette erreur est relativement rare mais distinctive, et tend à se produire lors de la frappe rapide lorsque les deux mains bougent simultanément.

Touche doublée

Une touche est pressée deux fois au lieu d’une. “the” devient “thee” ou “tthe.” Cela se produit lorsqu’un doigt appuie avec un peu trop de force ou reste sur la touche assez longtemps pour enregistrer une seconde activation. Sur les écrans tactiles, les touches doublées peuvent aussi résulter du fait que l’appareil enregistre le toucher initial et un léger décalage comme deux pressions distinctes.

Touche omise

Un caractère est entièrement omis. “the” devient “te” ou “th.” Le doigt visait la touche mais n’a pas appuyé assez fort, s’est déplacé trop vite pour que la frappe soit enregistrée, ou la frappe s’est perdue dans la transition entre les caractères. Les erreurs d’omission sont nettement plus fréquentes sur les écrans tactiles, où l’absence de course physique de la touche rend plus difficile la confirmation qu’une pression a été enregistrée.

Signes diacritiques

Les accents et caractères spéciaux sont supprimés, échangés ou mal appliqués. “é” devient “e,” “ü” devient “u,” ou “ñ” devient “n.” Sur les claviers sans touches dédiées aux signes diacritiques, produire des caractères accentués nécessite des combinaisons multi-touches ou des actions de pression prolongée qui sont faciles à rater. Ce type d’erreur est particulièrement pertinent pour les dispositions AZERTY et QWERTZ, qui gèrent les signes diacritiques différemment du QWERTY.

Majuscules et minuscules

Changements de casse involontaires. Une lettre qui devrait être en minuscule apparaît en majuscule, ou inversement. Cela se produit lorsque la touche Maj est pressée légèrement trop tôt, relâchée trop tard, ou accidentellement activée par un doigt voisin. “The” devient “THe” (Maj maintenue trop longtemps) ou “tHe” (Maj pressée en milieu de mot). L’activation du verrouillage majuscules produit des mots entiers dans la mauvaise casse.

Étirement du doigt

Erreurs causées par l’atteinte de touches éloignées de la rangée de base. Les caractères des rangées supérieure et inférieure nécessitent des mouvements de doigts plus longs, et plus un doigt parcourt de distance, plus le bruit moteur s’accumule. Atteindre “p” ou “q” depuis la rangée de base produit plus d’erreurs qu’atteindre “u” ou “r” car la distance est plus grande.

Erreurs de mots

Les erreurs au niveau des mots affectent des mots entiers plutôt que des caractères individuels. Elles sont moins fréquentes que les erreurs de caractères mais plus perturbatrices pour la lisibilité.

Mot répété

Le phénomène “the the”. Un mot entier est tapé deux fois de suite. Il s’agit davantage d’une erreur cognitive que motrice—le système de production linguistique du cerveau émet le même mot deux fois, souvent à la frontière entre deux pensées. C’est particulièrement courant au début d’une nouvelle ligne ou après une interruption du flux de frappe.

Omission de mot

Un mot entier est sauté. “I went to the store” devient “I went to store.” Le cerveau passe au mot suivant avant que les doigts n’aient fini de taper le mot en cours. Les omissions de mots augmentent avec la vitesse de frappe et sont courantes lorsque le rédacteur compose (pense et tape simultanément) plutôt que transcrit.

Duplication partielle

Une partie d’un mot est répétée. “important” devient “importantant” ou “keyboard” devient “keyboboard.” La séquence des doigts revient à une position antérieure dans le mot, rejouant une syllabe. Il s’agit d’une erreur de planification motrice où la séquence des mouvements des doigts est partiellement réinitialisée en cours de mot.

Erreurs d’espacement

La barre d’espace est la touche la plus utilisée sur tout clavier, et les erreurs qui la concernent sont étonnamment fréquentes. Les erreurs d’espacement modifient la structure visuelle du texte sans altérer les caractères eux-mêmes.

Espaces multiples

Espaces supplémentaires entre les mots. La barre d’espace est frappée deux fois, ou le pouce rebondit et produit un double appui. Sur les claviers physiques, la grande surface de la barre d’espace fait que de légers mouvements du pouce après l’appui initial peuvent être enregistrés comme des frappes supplémentaires. Sur les écrans tactiles, la large zone de toucher rend les doubles taps accidentels fréquents.

Espace manquant

Deux mots se retrouvent collés. “the quick” devient “thequick.” Le pouce a complètement manqué la barre d’espace, ou l’appui sur la barre d’espace n’a pas été enregistré. C’est l’une des erreurs les plus courantes sur les claviers de téléphone, où la barre d’espace est en concurrence avec d’autres touches et où le pouce doit effectuer un mouvement plus important pour l’atteindre.

Espacement irrégulier

Un espace apparaît à l’intérieur d’un mot au lieu d’entre les mots. “keyboard” devient “key board.” Le pouce frappe la barre d’espace au mauvais moment pendant un mot, le divisant en deux fragments. Cela peut aussi se produire lorsque le rédacteur fait une pause en milieu de mot pour réfléchir et que la pause est assez longue pour que la frappe suivante semble être un nouveau mot.

Erreurs de ponctuation

Les touches de ponctuation sont petites, nécessitent souvent la touche Maj et se trouvent à la périphérie du clavier. Tous ces facteurs augmentent les taux d’erreur.

Ponctuation manquante

Un point, une virgule ou un autre signe de ponctuation est entièrement omis. La variante la plus courante est un point manquant en fin de phrase, surtout lors de la frappe rapide et informelle où le rédacteur appuie sur Entrée ou Espace au lieu de chercher la touche du point. Dans la messagerie informelle, la ponctuation manquante est si courante qu’elle est devenue un choix stylistique.

Ponctuation erronée

Une touche de ponctuation voisine est frappée au lieu de celle visée. Un point devient une virgule (ils sont adjacents sur la plupart des dispositions), un point-virgule devient une apostrophe, ou un point d’interrogation devient une barre oblique. Comme les erreurs de touche adjacente pour les lettres, les erreurs de ponctuation erronée suivent la proximité des touches.

Ponctuation doublée

Un signe de ponctuation apparaît deux fois. “Bonjour..” au lieu de “Bonjour.” ou “Attendez,,” au lieu de “Attendez,”. Le doigt appuie deux fois sur la touche, ou la frappe est enregistrée deux fois en raison du rebond des touches sur les claviers mécaniques. Sur les écrans tactiles, la petite taille des cibles de ponctuation facilite la production de plusieurs taps.

Pourquoi la taxonomie complète est importante

La plupart des outils qui génèrent des erreurs de frappe n’implémentent qu’une ou deux de ces catégories—typiquement la substitution aléatoire de caractères et peut-être l’omission de caractères. Le résultat est un texte avec des erreurs, mais pas un texte avec des erreurs réalistes. La frappe humaine réelle produit tous ces types d’erreurs dans des proportions spécifiques qui dépendent de la vitesse du rédacteur, de l’appareil, de la disposition du clavier et de l’état émotionnel.

Une simulation convaincante de la frappe humaine doit produire des erreurs dans toutes les catégories : des erreurs de caractères qui suivent la proximité des touches, des erreurs de mots qui reflètent le traitement cognitif, des erreurs d’espacement qui résultent de la mécanique du pouce, et des erreurs de ponctuation qui suivent la disposition physique des touches de ponctuation. La distribution compte aussi—les substitutions par touche adjacente doivent dominer, les autres types d’erreurs apparaissant dans des proportions réalistes.

LikelyTypo modélise la taxonomie complète. Il génère des erreurs dans toutes les catégories, pondérées par la physique de chaque type d’erreur, et fait varier la distribution en fonction de l’appareil et du profil de frappe sélectionnés. Le résultat est un texte qui contient le même mélange d’erreurs qu’un véritable humain produirait—pas seulement du bruit aléatoire de caractères, mais le spectre complet de la façon dont les gens font réellement des fautes de frappe.

Explorez chaque type d’erreur de frappe

Générez du texte avec des erreurs réalistes dans toutes les catégories. Passez d’un appareil et d’un profil à l’autre pour voir comment les distributions d’erreurs changent.

Essayer la démonstration interactive

La prochaine fois que vous ferez une faute de frappe, prenez un moment pour la classifier. Était-ce une touche adjacente ? Un caractère omis ? Un espace doublé ? Une transposition ? Comprendre la taxonomie des erreurs de frappe transforme un désagrément quotidien en une fenêtre sur la complexité remarquable de la façon dont vos doigts, votre cerveau et votre clavier travaillent ensemble pour produire du langage—et comment ils sont parfois en désaccord.