Perfil
Frases
Vocabulary
Reviews
Lists
Favoritas
Comentarios
Comentarios sobre as frases de sacredceltic
Mensaxes no taboleiro
Rexistro
Audio
Transcriptions
Translate sacredceltic's sentences
@admin
please stop Ooneykcall to tag sentences with insults because he doesn't like his phrasing being challenged
see here https://tatoeba.org/fra/sentences/show/3764000
I think contributors who abuse the tagging system should be downgraded to simple contributors so they stop polluting the tags.
Belle prononciation, mraz ! J'aime ce hongrois-là.
Moi j'emploie la recherche avancée, afin d'obtenir des phrases d'une langue donnée dont les auteurs sont considérés « natifs » - bien que certains ne le soient pas, en vérité, et que c'est même indiqué dans leur profil, mais qu'ils se sont tout de même attribués, à tort, un niveau 5 dans la langue en question...- et j'exclue les mots que je ne veux pas traduire, comme "Tom", "Mary", "Ken", car ça n'a pour moi aucun intérêt.
Malheureusement, on ne peut pas obtenir de sélection en excluant seulement des mots. Je suis donc obligé de choisir au moins un mot figurant dans la sélection de phrases. Je le choisis donc au hasard. Ceci exclue les phrases ne présentant que des mots rares auxquels je ne pense pas, et je trouve cela très dommage.
J'exclue les phrases ayant déjà des traductions directes dans ma langue natale, le français.
Je me retrouve donc avec une liste de sélection, souvent de plusieurs pages, de phrases qui sont susceptibles de m'intéresser à traduire dans ma langue. Mon profil filtre seulement certaines langues qui m'intéressent, ce qui limite le nombre de traductions visibles.
Je choisis mes phrases de la liste selon l'auteur affiché, car je sais qui est vraiment natif et qui ne l'est pas. En cas de doute, je consulte le profil. Si le profil n'est pas correctement renseigné ou de manière qui me semble abusive ou trompeuse, je ne traduis pas les phrases concernées.
Je traduis directement dans la liste, en cliquant sur l'icône de traduction. Je fais parfois plusieurs traductions de la même phrase, pour créer des variantes, lorsqu'il m'en vient en tête. Si je pense que ma traduction correspond à 99% (100% est impossible...) à d'autres traductions, directes ou indirectes, de la liste, je sélectionne ma traduction, en cliquant sur l'icône de flèche la pointant, et je crée les liens vers les phrases, dans la même langue depuis laquelle je traduis, ou dans les autres langues que je maîtrise suffisamment pour m'assurer qu'elles correspondent, en cliquant sur l'icône du maillon.
Il m'arrive aussi au passage, de détacher des liens qui ne correspondent à l'évidence pas. En cas de doute, je clique sur la phrase et je laisse un commentaire.
J'arrive ainsi à avoir une productivité raisonnable mais je constate un ralentissement de temps en temps, durant lequel la traduction ne s'affiche pas. Il m'arrive parfois de créer des doublons suite à ces ralentissements, car je ne sais plus si j'ai ou non créé la traduction (qui ne s'affiche pas dans la liste où elle vient d'être créée)
Lorsque je sais que ma traduction existe déjà, j'essaie de la rechercher dans une seconde fenêtre, et de la lier dans la première fenêtre, via l'icône maillon de la barre d'icônes, en copiant l'url de la phrase dans la fenêtre de recherche.
J'essaie de relire périodiquement mon historique, afin de repérer des erreurs de saisie ou des fautes éventuelles et je les corrige alors. Ceci me permet aussi de voir les mauvaises reconnaissances automatiques de la langue, en voyant les drapeaux erronés sur mes phrases.
At the end of the day, the only translator mentioned on the remaining sentences will be Horus. Is that what we want ? I don't think so...
Besides, not knowing who made the translation renders all translations suspect, because Horus is no guarantee of correct matching of any pair of languages.
C'est tout simple :
Il suffit qu'Horus, avant de supprimer une phrase, mémorise ses liens de traduction, puis les recrée pour la phrase résultante, sans rien changer aux noms des traducteurs et aux dates de liaison/traduction.
C'est très clair, mais c'est mauvais et incompréhensible.
Le log doit refléter le travail sur les phrases, qui intéresse les utilisateurs/traducteurs et pas l'algorithmique informatique, qui n'intéresse que les techniciens.
Donc Horus doit juste se contenter de fusionner, pas de se substituer au traducteur.
Sur le log, doivent apparaître les liens de traductions et leurs auteurs, et les dates auxquelles ils ont effectués ces traductions. Seule l'entrée signalant la fusion devrait être créditée à Horus, pas les liens.
Ce n'est pas bon. Je suis non seulement l'auteur de la phrase, mais aussi de sa liaison de traduction. Ce n'est pas Horus qui a inventé ce lien, c'est moi, ce n'est donc pas Horus qui doit apparaître dans le log pour cela. Horus a juste supprimé une phrase. C'est son seul crédit.
a "linking" is actually a translation. I am credited for 1, although I made 2. Horus should not be credited with any translation, because it doesn't translate...
People should be credited with coining sentences and ALSO with translating, which I do very much, while Horus doesn't...
here is the scheme :
I translate English sentence E1 to French sentence F1
Then I translate English sentence E2 to a French sentence that happens to also be F1, because this is the correct translation.
Then Horus merges my 2 F1s and credits itself for the translation from E2 to F1. That is wrong. I should be credited. Horus doesn't translate anything. It just merges duplicate sentences.
What I mean is : Horus, according to the logs, looks like it did the translation. This is wrong. I did it. Horus shouldn't substitute to the translator.
*** Horus vole la propriété des traductions ***
lorsqu'on traduit une phrase A par une phrase B qui existe déjà et traduit une phrase C, la phrase B est détruite, et la phrase A est raccrochée à la phrase C, mais Horus apparaît alors comme le traducteur, dans le log de la phrase C, ce qui est inexact. Ce n'est pas parce qu'on crée un doublon qu'on n'est pas l'auteur, pour autant, d'une nouvelle traduction.
exemple https://tatoeba.org/fra/sentences/show/2947527
And I add that a good language detection, based on language analysis, would be a very good introduction to Tatoeba, attracting more contributors, because people start contributing before they care to fill in their profile.
Seeing that the service doesn't correctly identify the language in which one is contributing is a deterrent to using the service as a whole.
An impressive automatic detection would be a good way (not the only one, though) to keep newcomers contributing.
language detection shouldn't rely on contributors' abilities but on language analysis. If it is based on contibutors' abilities, the language analysis will never improve...
>The short answer is: the Tatoeba language autodetection engine is not perfect.
The problem is not that the algorithm is defective, it is that the underlying data is not maintained. Tatodetect is based on statistical analysis of characters sequence frequencies. Its accuracy should grow along with the corpus, but it doesn't, because I think the corpus is not fed automatically to it as it grows. I suspect the feeding is not automated and nobody updates it manually, since I have seen no improvement since Allan left the project.
A pity in my view, because it was a very good scheme.
*** l'algorithme de détection automatique de langues ne semble plus apprendre ***
Normalement, l'algorithme est censé s'améliorer avec la croissance du corpus, puisque son analyse de fréquences de séquences de caractères se repose sur les phrases du corpus, mais j'ai l'impression qu'il ne s'améliore pas. Il conviendrait peut-être de remettre à jour ses tables de séquences...
>l’existence des phrases identiques n’est pas approuvée sur Tatoeba
le problème est qu'elles ne sont pas identiques du fait du type d'espace et qu'il n'y a pas, sur Tatoeba, ni de consensus ni d'automatisme permettant de normaliser ces espaces.
La règle typographique française est que l'espace avant un point double doit être fine (la finesse est à définir et , dans certaines polices de caractères par défaut, sur Tatoeba, l'espace fine est invisible, donc elle n'est plus fine. Par ailleurs, les utilisateurs, surtout les non-français, ne savent pas produire des espaces fines.
Personnellement, je suis pour une normalisation de l'espace fine, qui devrait automatiquement remplacer les espaces standards. Encore faut-il qu'elle soit visible dans les polices par défaut du service, sinon les Français refuseront de l'employer et on retournera au point de départ.
Le même problème se pose avec les apostrophes. La plupart emploient l'apostrophe informatique ' qui n'est pas correcte en typographie française. Il faudrait automatiquement y substituer ’
Il y a donc également des faux doublons dûs aux apostrophes sur Tatoeba.
Je suis sûr que la langue française n'est pas la seule qui pose ce type de problème d'uniformisation de la graphie...
Le français n'emploie qu'un alphabet. Certaines langues en emploient 3, ce qui multiplie les faux doublons...
Qui s'en soucie ? Et pourquoi ?
The content of this message goes against our rules and was therefore hidden. It is displayed only to admins and to the author of the message.
The content of this message goes against our rules and was therefore hidden. It is displayed only to admins and to the author of the message.
What is a "whitelisted" sentence ?
>que le berbère soit accepté comme une seule langue (et non pas comme étant plusieurs langues différentes), car c'est ainsi que la quasi-totalité de ses locuteurs et les gouvernements algérien et marocain le considèrent.
Ça s'appelle : diviser pour mieux régner.
César est censé en être l'inventeur, et, de fait, c'est ainsi qu'il a réussi à réduire la Gaule, trop divisée entre ses tribus. Depuis, c'est ainsi que l'Angleterre a réduit le Pays de Galles, l'Écosse, puis la malheureuse Irlande...
L'intérêt du Maroc, de l'Algérie, mais aussi de la Libye, sont de nier l'existence d'une communauté berbère trans-frontalière...comme la Turquie, l'Iran et la Syrie nient l'existence de la communauté Kurde...