Pourquoi nettoyer les espaces de votre texte ?
Lorsque vous copiez du texte depuis un PDF, un email ou une page web, des caractères invisibles parasites s'ajoutent souvent : espaces multiples, tabulations, espaces insécables ( ), retours à la ligne Windows (\r\n), etc. Ces artefacts peuvent causer des problèmes dans vos documents ou applications.
Les espaces multiples
Deux espaces consécutifs ou plus sont généralement une erreur de frappe ou un artefact de copier-coller. La règle typographique française (et internationale) impose un seul espace entre les mots. Notre outil fusionne automatiquement les espaces multiples en un seul.
Les tabulations
Le caractère tabulation (\t) est utilisé dans les tableurs et fichiers CSV pour séparer les colonnes. Dans un texte normal, il crée des décalages visuels imprévisibles. L'option "Tabulations" les remplace par des espaces standards.
Les sauts de ligne multiples
Un document Word mal formaté peut contenir 3, 4 ou 5 sauts de ligne consécutifs là où 2 suffiraient (séparation de paragraphes). Notre outil normalise ces excès en conservant un maximum de 2 sauts de ligne consécutifs.
Les espaces insécables ( )
L'espace insécable (Unicode U+00A0 ou entité HTML ) empêche le retour à la ligne entre deux mots. Il est correct devant les ponctuations doubles en français (: ; ! ?), mais les pages web en abusent souvent. Notre outil les convertit en espaces normaux.
Questions fréquentes
Mon texte copié depuis PDF est illisible, pourquoi ?
Les PDF convertissent parfois les sauts de ligne en espaces, ou ajoutent des caractères spéciaux pour la mise en page. Utilisez notre outil avec toutes les options cochées pour un nettoyage complet.
La fonction Trim c'est quoi exactement ?
"Trim" (en anglais "couper") supprime les espaces au début et à la fin d'une chaîne de caractères. Le "Trim lignes" applique cette fonction à chaque ligne, le "Trim global" au texte entier.
Pourquoi mon pourcentage de réduction est-il si élevé ?
Un pourcentage élevé (> 15%) indique que votre texte source contenait beaucoup de caractères parasites. C'est fréquent avec les exports PDF, les emails HTML ou le copier-coller depuis des sites web mal codés.
Puis-je utiliser cet outil pour du code ?
Avec précaution. L'indentation en code utilise des espaces ou tabulations intentionnels. Décochez "Espaces multiples" et "Tabulations" si vous nettoyez du code, ou utilisez un formateur de code dédié (Prettier, Black, etc.).