Profilo
Frazoj
Vortaro
Revizioj
Listoj
Preferaĵoj
Komentoj
Komentoj pri frazoj de sacredceltic
Muraj mesaĝoj
Registroj
Sono
Transskriboj
Traduki la frazojn de sacredceltic

language detection shouldn't rely on contributors' abilities but on language analysis. If it is based on contibutors' abilities, the language analysis will never improve...

>The short answer is: the Tatoeba language autodetection engine is not perfect.
The problem is not that the algorithm is defective, it is that the underlying data is not maintained. Tatodetect is based on statistical analysis of characters sequence frequencies. Its accuracy should grow along with the corpus, but it doesn't, because I think the corpus is not fed automatically to it as it grows. I suspect the feeding is not automated and nobody updates it manually, since I have seen no improvement since Allan left the project.
A pity in my view, because it was a very good scheme.

*** l'algorithme de détection automatique de langues ne semble plus apprendre ***
Normalement, l'algorithme est censé s'améliorer avec la croissance du corpus, puisque son analyse de fréquences de séquences de caractères se repose sur les phrases du corpus, mais j'ai l'impression qu'il ne s'améliore pas. Il conviendrait peut-être de remettre à jour ses tables de séquences...

>l’existence des phrases identiques n’est pas approuvée sur Tatoeba
le problème est qu'elles ne sont pas identiques du fait du type d'espace et qu'il n'y a pas, sur Tatoeba, ni de consensus ni d'automatisme permettant de normaliser ces espaces.
La règle typographique française est que l'espace avant un point double doit être fine (la finesse est à définir et , dans certaines polices de caractères par défaut, sur Tatoeba, l'espace fine est invisible, donc elle n'est plus fine. Par ailleurs, les utilisateurs, surtout les non-français, ne savent pas produire des espaces fines.
Personnellement, je suis pour une normalisation de l'espace fine, qui devrait automatiquement remplacer les espaces standards. Encore faut-il qu'elle soit visible dans les polices par défaut du service, sinon les Français refuseront de l'employer et on retournera au point de départ.
Le même problème se pose avec les apostrophes. La plupart emploient l'apostrophe informatique ' qui n'est pas correcte en typographie française. Il faudrait automatiquement y substituer ’
Il y a donc également des faux doublons dûs aux apostrophes sur Tatoeba.
Je suis sûr que la langue française n'est pas la seule qui pose ce type de problème d'uniformisation de la graphie...
Le français n'emploie qu'un alphabet. Certaines langues en emploient 3, ce qui multiplie les faux doublons...

Qui s'en soucie ? Et pourquoi ?
La enhavo de tiu mesaĝo kontraŭas niajn regulojn kaj pro tio estas kaŝita. Ĝi aperas nur al administrantoj kaj la aŭtoro de la mesaĝo.
La enhavo de tiu mesaĝo kontraŭas niajn regulojn kaj pro tio estas kaŝita. Ĝi aperas nur al administrantoj kaj la aŭtoro de la mesaĝo.

What is a "whitelisted" sentence ?

>que le berbère soit accepté comme une seule langue (et non pas comme étant plusieurs langues différentes), car c'est ainsi que la quasi-totalité de ses locuteurs et les gouvernements algérien et marocain le considèrent.
Ça s'appelle : diviser pour mieux régner.
César est censé en être l'inventeur, et, de fait, c'est ainsi qu'il a réussi à réduire la Gaule, trop divisée entre ses tribus. Depuis, c'est ainsi que l'Angleterre a réduit le Pays de Galles, l'Écosse, puis la malheureuse Irlande...
L'intérêt du Maroc, de l'Algérie, mais aussi de la Libye, sont de nier l'existence d'une communauté berbère trans-frontalière...comme la Turquie, l'Iran et la Syrie nient l'existence de la communauté Kurde...

Bon courage pour ça, Omar, ce n'est pas si compliqué et c'est une très bonne idée pour attirer de nouveaux contributeurs du berbère. Ce serait vraiment bien !

What I witness, lately, are "linking frenzies" that end up most of the time in wrong translations. I warn advanced contributors against the "linking temptation" in between languages that you're not a native of at least one of the 2 and fluent in the other. Many links appear "tempting" but actually are lures, as they are correct for translating one language but not another. So please stop uncontrolled linking frenzies, they're devastating when it comes to translation quality !

i tried on both Chrome and Safari : same problem. The button won't operate.

i don't know what they represent, but clearly not a ranking of "most translated languages" on Tatoeba, as erroneously claimed by their title.
Obviously, in some parts of the world, statistics will forever be useless, despite past gross mistakes...

And the 25th quinquennial plan will produce 200% more corn !

How ridiculous ! The less translations, the most translated you are ! Typical Poutine-type propaganda !
4 Russian 316,963 299,109 (94.37%) 502,936 translations
7 French 271,363 263,749 (97.19%) 703,829 translations

Actually, you should add in your statistics sentences owned by natives and sentences OK-ed by natives. That would reflect the un-nativeness better...

That's what I thought. So Japanese is not as un-native as English or French are.
French is actually the most un-native language on Tatoeba, with around 30% of sentences written by non-natives, and that's why I'm still here, after all, because I hate to see my language so ill-represented.

Isn't the graph distorted, as in the case of Japanese, by unowned sentences ? How do you account them ? Blue or red ? Actually, most unowned Japanese sentences originate from the Tanaka Corpus, which was built by natives...

*** impossible d'adopter une phrase depuis l'iPhone ***
il n'est désormais plus possible d'adopter une phrase depuis l'iPhone (en tout cas depuis mon iPhone 5). En effet, l'icône d'adoption y apparaît tronquée et ne s'y active pas. La zone d'affichage est trop réduite.

Ah ben tu vois, je devais me douter que tu travaillais sur un Wikipédia berbère, puisque j'ai posé la question ! J'avais la puce à l'oreille, comme on dit !
Je vois donc que tu as du pain sur la planche ! Dire qu'il y a des gens qui s'emmerdent à la retraite, tandis que toi tu as du boulot pour des siècles !
Informe-moi lorsque le Wikipédia berbère sera public ! J'irai jeter un œil !
Et Google translate, ils s'y mettent bientôt ? Maintenant qu'il y a un peu de ressources, ça pourrait commencer à marcher...