menu
Tatoeba
language
S'inscrire Se connecter
language Français
menu
Tatoeba

chevron_right S'inscrire

chevron_right Se connecter

Parcourir

chevron_right Montrer une phrase au hasard

chevron_right Parcourir par langue

chevron_right Parcourir par liste

chevron_right Parcourir par étiquette

chevron_right Parcourir les enregistrements sonores

Communauté

chevron_right Mur

chevron_right Liste de tous les membres

chevron_right Langues des membres

chevron_right Langues natales des membres

search
clear
swap_horiz
search
Wezel Wezel 20 octobre 2015, modifiée le le 20 octobre 2015 20 octobre 2015 à 19:55:15 UTC, modifiée le 20 octobre 2015 à 19:58:53 UTC link Permalien

I don’t know if this issue has been raised before, but here it is:

We have some pairs of duplicate sentences (#1846151 and #1170836, #1846153 and #1170837) which don’t get merged because one of them apparently has a non-breaking space before the exclamation mark while the other one has an ordinary space, and there are sure to be a number of such sentences in the French corpus. Can something be done about this? Or do we have to just leave a comment under the latest of such pairs so that its owner might change it?

{{vm.hiddenReplies[24674] ? 'expand_more' : 'expand_less'}} cacher les réponses montrer les réponses
sacredceltic sacredceltic 20 octobre 2015 20 octobre 2015 à 20:20:23 UTC link Permalien

Qui s'en soucie ? Et pourquoi ?

{{vm.hiddenReplies[24675] ? 'expand_more' : 'expand_less'}} cacher les réponses montrer les réponses
Wezel Wezel 20 octobre 2015 20 octobre 2015 à 20:33:51 UTC link Permalien

Si ce n’est pas une raison de se soucier, c’est bien. Mais je crois que l’existence des phrases identiques n’est pas approuvée sur Tatoeba, et c’est pourquoi il y a un programme pour les supprimer…

{{vm.hiddenReplies[24676] ? 'expand_more' : 'expand_less'}} cacher les réponses montrer les réponses
sacredceltic sacredceltic 21 octobre 2015 21 octobre 2015 à 17:15:35 UTC link Permalien

>l’existence des phrases identiques n’est pas approuvée sur Tatoeba

le problème est qu'elles ne sont pas identiques du fait du type d'espace et qu'il n'y a pas, sur Tatoeba, ni de consensus ni d'automatisme permettant de normaliser ces espaces.
La règle typographique française est que l'espace avant un point double doit être fine (la finesse est à définir et , dans certaines polices de caractères par défaut, sur Tatoeba, l'espace fine est invisible, donc elle n'est plus fine. Par ailleurs, les utilisateurs, surtout les non-français, ne savent pas produire des espaces fines.

Personnellement, je suis pour une normalisation de l'espace fine, qui devrait automatiquement remplacer les espaces standards. Encore faut-il qu'elle soit visible dans les polices par défaut du service, sinon les Français refuseront de l'employer et on retournera au point de départ.

Le même problème se pose avec les apostrophes. La plupart emploient l'apostrophe informatique ' qui n'est pas correcte en typographie française. Il faudrait automatiquement y substituer ’
Il y a donc également des faux doublons dûs aux apostrophes sur Tatoeba.

Je suis sûr que la langue française n'est pas la seule qui pose ce type de problème d'uniformisation de la graphie...
Le français n'emploie qu'un alphabet. Certaines langues en emploient 3, ce qui multiplie les faux doublons...

{{vm.hiddenReplies[24679] ? 'expand_more' : 'expand_less'}} cacher les réponses montrer les réponses
Wezel Wezel 21 octobre 2015, modifiée le le 21 octobre 2015 21 octobre 2015 à 18:00:15 UTC, modifiée le 21 octobre 2015 à 18:02:43 UTC link Permalien

> le problème est qu'elles ne sont pas identiques
> du fait du type d'espace et qu'il n'y a pas,
> sur Tatoeba, ni de consensus ni d'automatisme
> permettant de normaliser ces espaces

Oui, c’est ce que je voulais dire. En fait, il existe jusqu’à quatre versions de l’espace qui, théoriquement, peuvent être employées dans ces cas-là (devant le point d’interrogation, le point d’exclamation etc.) — l’espace ordinaire, l’espase insécable, l’espace fine et l’espace fine insécable. Pourtant, cet article dit que « Le code typographique français recommande une espace fine insécable devant les signes de ponctuation doubles (point-virgule, point d’interrogation, point d’exclamation, sauf deux-points) » :
https://fr.wikipedia.org/wiki/E...ins%C3%A9cable

i. e. il faut la mettre dans le cas de #1846151 et #1846153 , par exemple. (Et moi, personnellement, je l’ai mise dans mes phrases françaises.)

Vous avez raison, il faut que quelque chose se soit mise d’accord sur ce problème.

> Personnellement, je suis pour une normalisation
> de l'espace fine, qui devrait automatiquement
> remplacer les espaces standards.

Je suis d’accord.

> Le même problème se pose avec les apostrophes.

Aussi avec les guillemets (" " vs. « »). À propos, pour autant que je sache, il faut aussi employer l’espace fine insécable après le guillemet ouvrant et devant le guillemet fermant.