Menu
Il y a toujours des doublons causés par les apostrophes de graphies différentes :
http://tatoeba.org/fre/sentences/show/1401543
http://tatoeba.org/fre/sentences/show/549539
Ne peut-on pas réaligner ces apostrophes selon les conventions typographiques en vigueur, et plus généralement, les convertir à la saisie.
Je cite Wikipédia :
«
L’apostrophe a traditionnellement la forme d’une virgule placée en hauteur. On retrouve déjà cette définition d’« une virgule que l’on met un peu au-dessus du mot » dès la première édition du Dictionnaire de l'Académie française (1694)1 et plus récemment chez Jean-Pierre Lacroux : « Une virgule libérée de la pesanteur qui la clouait sur la ligne de base »2. En allemand, dans le langage courant ou populaire, elle est nommée Hochkomma, littéralement « virgule haute ».
En raison des contraintes techniques des claviers de machines à écrire, puis de nos jours de ceux des ordinateurs, elle est très souvent tracée comme une barre verticale droite dans les documents informatiques. Cette apostrophe est alors appelée « apostrophe dactylographique » (car apparue avec les machines à écrire mécaniques utilisant une seule touche pour l’apostrophe et le guillemet anglais ouvrant ou fermant, ou même d’autres signes comme l’accent aigu), « apostrophe droite » (car elle est souvent droite pour le guillemet anglais ouvrant ou fermant, mais pas toujours), apostrophe informatique3 ou d’autres noms plus imagés4. Les expressions « apostrophe dactylographique » et « apostrophe typographique » sont utilisées par Aurel Ramat5.
Selon les usages des typographes, l’apostrophe dactylographique ne devrait pas être employée6,7 et, par exemple, pour Lacroux, ce « n’est pas une apostrophe. […] Ce n’est typographiquement rien »2.
»
La contrainte technique n'existe plus, donc...
Il y a aussi des doublons causés par l'espace avant la punctuation, surtout en français. Par exemple:
http://tatoeba.org/ita/sentences/show/444788
http://tatoeba.org/ita/sentences/show/1869503
La solution, c'est la conversion à la saisie.