Menu
I don’t know if this issue has been raised before, but here it is:
We have some pairs of duplicate sentences (#1846151 and #1170836, #1846153 and #1170837) which don’t get merged because one of them apparently has a non-breaking space before the exclamation mark while the other one has an ordinary space, and there are sure to be a number of such sentences in the French corpus. Can something be done about this? Or do we have to just leave a comment under the latest of such pairs so that its owner might change it?
Qui s'en soucie ? Et pourquoi ?
Si ce n’est pas une raison de se soucier, c’est bien. Mais je crois que l’existence des phrases identiques n’est pas approuvée sur Tatoeba, et c’est pourquoi il y a un programme pour les supprimer…
>l’existence des phrases identiques n’est pas approuvée sur Tatoeba
le problème est qu'elles ne sont pas identiques du fait du type d'espace et qu'il n'y a pas, sur Tatoeba, ni de consensus ni d'automatisme permettant de normaliser ces espaces.
La règle typographique française est que l'espace avant un point double doit être fine (la finesse est à définir et , dans certaines polices de caractères par défaut, sur Tatoeba, l'espace fine est invisible, donc elle n'est plus fine. Par ailleurs, les utilisateurs, surtout les non-français, ne savent pas produire des espaces fines.
Personnellement, je suis pour une normalisation de l'espace fine, qui devrait automatiquement remplacer les espaces standards. Encore faut-il qu'elle soit visible dans les polices par défaut du service, sinon les Français refuseront de l'employer et on retournera au point de départ.
Le même problème se pose avec les apostrophes. La plupart emploient l'apostrophe informatique ' qui n'est pas correcte en typographie française. Il faudrait automatiquement y substituer ’
Il y a donc également des faux doublons dûs aux apostrophes sur Tatoeba.
Je suis sûr que la langue française n'est pas la seule qui pose ce type de problème d'uniformisation de la graphie...
Le français n'emploie qu'un alphabet. Certaines langues en emploient 3, ce qui multiplie les faux doublons...
> le problème est qu'elles ne sont pas identiques
> du fait du type d'espace et qu'il n'y a pas,
> sur Tatoeba, ni de consensus ni d'automatisme
> permettant de normaliser ces espaces
Oui, c’est ce que je voulais dire. En fait, il existe jusqu’à quatre versions de l’espace qui, théoriquement, peuvent être employées dans ces cas-là (devant le point d’interrogation, le point d’exclamation etc.) — l’espace ordinaire, l’espase insécable, l’espace fine et l’espace fine insécable. Pourtant, cet article dit que « Le code typographique français recommande une espace fine insécable devant les signes de ponctuation doubles (point-virgule, point d’interrogation, point d’exclamation, sauf deux-points) » :
https://fr.wikipedia.org/wiki/E...ins%C3%A9cable
i. e. il faut la mettre dans le cas de #1846151 et #1846153 , par exemple. (Et moi, personnellement, je l’ai mise dans mes phrases françaises.)
Vous avez raison, il faut que quelque chose se soit mise d’accord sur ce problème.
> Personnellement, je suis pour une normalisation
> de l'espace fine, qui devrait automatiquement
> remplacer les espaces standards.
Je suis d’accord.
> Le même problème se pose avec les apostrophes.
Aussi avec les guillemets (" " vs. « »). À propos, pour autant que je sache, il faut aussi employer l’espace fine insécable après le guillemet ouvrant et devant le guillemet fermant.