menu
Tatoeba
language
Registriĝi Ensaluti
language Esperanto
menu
Tatoeba

chevron_right Registriĝi

chevron_right Ensaluti

Foliumi

chevron_right Montri hazardan frazon

chevron_right Foliumi laŭ lingvo

chevron_right Foliumi laŭ listo

chevron_right Foliumi laŭ etikedo

chevron_right Foliumi sonregistraĵojn

Komunumo

chevron_right Muro

chevron_right Listo de ĉiuj membroj

chevron_right Lingvoj de la membroj

chevron_right Denaskaj parolantoj

search
clear
swap_horiz
search
sacredceltic {{ icon }} keyboard_arrow_right

Profilo

keyboard_arrow_right

Frazoj

keyboard_arrow_right

Vortaro

keyboard_arrow_right

Revizioj

keyboard_arrow_right

Listoj

keyboard_arrow_right

Preferaĵoj

keyboard_arrow_right

Komentoj

keyboard_arrow_right

Komentoj pri frazoj de sacredceltic

keyboard_arrow_right

Muraj mesaĝoj

keyboard_arrow_right

Registroj

keyboard_arrow_right

Sono

keyboard_arrow_right

Transskriboj

translate

Traduki la frazojn de sacredceltic

Surmuraj mesaĝoj de s% (entute sacredceltic)

sacredceltic sacredceltic 2015-novembro-05, modifita 2015-novembro-05 2015-novembro-05 11:00:09 UTC, modifita 2015-novembro-05 16:15:52 UTC link Konstanta ligilo

language detection shouldn't rely on contributors' abilities but on language analysis. If it is based on contibutors' abilities, the language analysis will never improve...

sacredceltic sacredceltic 2015-novembro-05 2015-novembro-05 10:55:22 UTC link Konstanta ligilo

>The short answer is: the Tatoeba language autodetection engine is not perfect.

The problem is not that the algorithm is defective, it is that the underlying data is not maintained. Tatodetect is based on statistical analysis of characters sequence frequencies. Its accuracy should grow along with the corpus, but it doesn't, because I think the corpus is not fed automatically to it as it grows. I suspect the feeding is not automated and nobody updates it manually, since I have seen no improvement since Allan left the project.
A pity in my view, because it was a very good scheme.

sacredceltic sacredceltic 2015-oktobro-23 2015-oktobro-23 09:36:37 UTC link Konstanta ligilo

*** l'algorithme de détection automatique de langues ne semble plus apprendre ***

Normalement, l'algorithme est censé s'améliorer avec la croissance du corpus, puisque son analyse de fréquences de séquences de caractères se repose sur les phrases du corpus, mais j'ai l'impression qu'il ne s'améliore pas. Il conviendrait peut-être de remettre à jour ses tables de séquences...

sacredceltic sacredceltic 2015-oktobro-21 2015-oktobro-21 17:15:35 UTC link Konstanta ligilo

>l’existence des phrases identiques n’est pas approuvée sur Tatoeba

le problème est qu'elles ne sont pas identiques du fait du type d'espace et qu'il n'y a pas, sur Tatoeba, ni de consensus ni d'automatisme permettant de normaliser ces espaces.
La règle typographique française est que l'espace avant un point double doit être fine (la finesse est à définir et , dans certaines polices de caractères par défaut, sur Tatoeba, l'espace fine est invisible, donc elle n'est plus fine. Par ailleurs, les utilisateurs, surtout les non-français, ne savent pas produire des espaces fines.

Personnellement, je suis pour une normalisation de l'espace fine, qui devrait automatiquement remplacer les espaces standards. Encore faut-il qu'elle soit visible dans les polices par défaut du service, sinon les Français refuseront de l'employer et on retournera au point de départ.

Le même problème se pose avec les apostrophes. La plupart emploient l'apostrophe informatique ' qui n'est pas correcte en typographie française. Il faudrait automatiquement y substituer ’
Il y a donc également des faux doublons dûs aux apostrophes sur Tatoeba.

Je suis sûr que la langue française n'est pas la seule qui pose ce type de problème d'uniformisation de la graphie...
Le français n'emploie qu'un alphabet. Certaines langues en emploient 3, ce qui multiplie les faux doublons...

sacredceltic sacredceltic 2015-oktobro-20 2015-oktobro-20 20:20:23 UTC link Konstanta ligilo

Qui s'en soucie ? Et pourquoi ?

2015-oktobro-20, modifita 2015-oktobro-20 2015-oktobro-20 06:32:37 UTC, modifita 2015-oktobro-20 23:00:14 UTC link Konstanta ligilo
warning

La enhavo de tiu mesaĝo kontraŭas niajn regulojn kaj pro tio estas kaŝita. Ĝi aperas nur al administrantoj kaj la aŭtoro de la mesaĝo.

2015-oktobro-19, modifita 2015-oktobro-20 2015-oktobro-19 20:41:06 UTC, modifita 2015-oktobro-20 22:59:41 UTC link Konstanta ligilo
warning

La enhavo de tiu mesaĝo kontraŭas niajn regulojn kaj pro tio estas kaŝita. Ĝi aperas nur al administrantoj kaj la aŭtoro de la mesaĝo.

sacredceltic sacredceltic 2015-oktobro-19 2015-oktobro-19 16:37:25 UTC link Konstanta ligilo

What is a "whitelisted" sentence ?

sacredceltic sacredceltic 2015-oktobro-18 2015-oktobro-18 20:52:34 UTC link Konstanta ligilo

>que le berbère soit accepté comme une seule langue (et non pas comme étant plusieurs langues différentes), car c'est ainsi que la quasi-totalité de ses locuteurs et les gouvernements algérien et marocain le considèrent.

Ça s'appelle : diviser pour mieux régner.
César est censé en être l'inventeur, et, de fait, c'est ainsi qu'il a réussi à réduire la Gaule, trop divisée entre ses tribus. Depuis, c'est ainsi que l'Angleterre a réduit le Pays de Galles, l'Écosse, puis la malheureuse Irlande...
L'intérêt du Maroc, de l'Algérie, mais aussi de la Libye, sont de nier l'existence d'une communauté berbère trans-frontalière...comme la Turquie, l'Iran et la Syrie nient l'existence de la communauté Kurde...

sacredceltic sacredceltic 2015-oktobro-18 2015-oktobro-18 13:00:56 UTC link Konstanta ligilo

Bon courage pour ça, Omar, ce n'est pas si compliqué et c'est une très bonne idée pour attirer de nouveaux contributeurs du berbère. Ce serait vraiment bien !

sacredceltic sacredceltic 2015-oktobro-18, modifita 2015-oktobro-18 2015-oktobro-18 12:55:22 UTC, modifita 2015-oktobro-18 12:58:45 UTC link Konstanta ligilo

What I witness, lately, are "linking frenzies" that end up most of the time in wrong translations. I warn advanced contributors against the "linking temptation" in between languages that you're not a native of at least one of the 2 and fluent in the other. Many links appear "tempting" but actually are lures, as they are correct for translating one language but not another. So please stop uncontrolled linking frenzies, they're devastating when it comes to translation quality !

sacredceltic sacredceltic 2015-oktobro-16 2015-oktobro-16 05:32:28 UTC link Konstanta ligilo

i tried on both Chrome and Safari : same problem. The button won't operate.

sacredceltic sacredceltic 2015-oktobro-13 2015-oktobro-13 04:56:48 UTC link Konstanta ligilo

i don't know what they represent, but clearly not a ranking of "most translated languages" on Tatoeba, as erroneously claimed by their title.
Obviously, in some parts of the world, statistics will forever be useless, despite past gross mistakes...

sacredceltic sacredceltic 2015-oktobro-12 2015-oktobro-12 21:07:14 UTC link Konstanta ligilo

And the 25th quinquennial plan will produce 200% more corn !

sacredceltic sacredceltic 2015-oktobro-12 2015-oktobro-12 21:01:16 UTC link Konstanta ligilo

How ridiculous ! The less translations, the most translated you are ! Typical Poutine-type propaganda !

4 Russian 316,963 299,109 (94.37%) 502,936 translations
7 French 271,363 263,749 (97.19%) 703,829 translations

sacredceltic sacredceltic 2015-oktobro-11 2015-oktobro-11 14:10:46 UTC link Konstanta ligilo

Actually, you should add in your statistics sentences owned by natives and sentences OK-ed by natives. That would reflect the un-nativeness better...

sacredceltic sacredceltic 2015-oktobro-11 2015-oktobro-11 14:03:05 UTC link Konstanta ligilo

That's what I thought. So Japanese is not as un-native as English or French are.
French is actually the most un-native language on Tatoeba, with around 30% of sentences written by non-natives, and that's why I'm still here, after all, because I hate to see my language so ill-represented.

sacredceltic sacredceltic 2015-oktobro-11 2015-oktobro-11 13:44:42 UTC link Konstanta ligilo

Isn't the graph distorted, as in the case of Japanese, by unowned sentences ? How do you account them ? Blue or red ? Actually, most unowned Japanese sentences originate from the Tanaka Corpus, which was built by natives...

sacredceltic sacredceltic 2015-oktobro-11 2015-oktobro-11 08:30:02 UTC link Konstanta ligilo

*** impossible d'adopter une phrase depuis l'iPhone ***

il n'est désormais plus possible d'adopter une phrase depuis l'iPhone (en tout cas depuis mon iPhone 5). En effet, l'icône d'adoption y apparaît tronquée et ne s'y active pas. La zone d'affichage est trop réduite.

sacredceltic sacredceltic 2015-oktobro-10 2015-oktobro-10 09:08:11 UTC link Konstanta ligilo

Ah ben tu vois, je devais me douter que tu travaillais sur un Wikipédia berbère, puisque j'ai posé la question ! J'avais la puce à l'oreille, comme on dit !
Je vois donc que tu as du pain sur la planche ! Dire qu'il y a des gens qui s'emmerdent à la retraite, tandis que toi tu as du boulot pour des siècles !

Informe-moi lorsque le Wikipédia berbère sera public ! J'irai jeter un œil !

Et Google translate, ils s'y mettent bientôt ? Maintenant qu'il y a un peu de ressources, ça pourrait commencer à marcher...