Wall (7,162 threads)
Tips
Before asking a question, make sure to read the FAQ.
We aim to maintain a healthy atmosphere for civilized discussions. Please read our rules against bad behavior.
sharptoothed
yesterday
CK
3 days ago
Seael
3 days ago
gillux
6 days ago
sacredceltic
6 days ago
sacredceltic
6 days ago
Seael
7 days ago
Guybrush88
8 days ago
Seael
8 days ago
StanJones
10 days ago

Je tiens à soulever ici le problème de l'intervention de modérateurs pour arbitrer des différents de définition de langages qui ne sont pas les leurs.
En effet, je me trouve de manière répétée dans la situation suivante;
1) un non-natif crée une phrase dans ma langue natale
2) j'indique qu'un mot de cette phrase ne fait pas partie de cette langue
3) L'auteur, par des pirouettes multiples, prétend à l'appartenance à un dialecte imaginaire
4) des modérateurs non-natifs de cette langue, voire qui ne la parlent pas du tout interviennent dans le débat, pour certains EN ANGLAIS, au mépris de la langue d'origine de la discussion et prétendent vouloir définir ce qu'est un dialecte ou un anglicisme de la langue dont ils ne sont pas natifs ou qu'ils ne parlent même pas du tout.
J'estime que les modérateurs non-natifs de la langue en question outrepassent leur droit d'intervention quand ils prennent parti dans un tel débat, d'autant plus quand ils ne parlent pas cette langue.
Et en tout état de cause, il est encore plus inacceptable que ces mêmes modérateurs interviennent dans ces débats dans LEUR LANGUE, plutôt que dans la langue en question.
J'attire l'attention sur le fait que les anglophones sont particulièrement mal placés pour définir des langues comme le français et les règles qui peuvent s'y appliquer puisque ces langues sont des constructions totalement différentes, avec des histoires différentes, des objets différents, des institutions différentes, des références différentes.
Par ailleurs, la notion de dialecte ne saurait être étendue à l'acceptation de vocabulaire d'une langue étrangère traduit mot à mot et utilisé par des non-natifs de la langue concernée, auquel cas nous serions obligés de considérer que tous les mots de toutes les langues sont acceptés dans toutes les langues, ce qui serait une absurdité et finirait par les diluer dans une espèce de magma sans nom.
Je constate ainsi que des milliers de phrases françaises (et j'imagine d'autres langues), dont beaucoup sont douteuses, sont détenues par des non-natifs militants de ce "dialectalisme effrené". A cette échelle, cela met en cause la validité et la crédibilité du corpus de la langue considérée et démotive les contributeurs natifs qui voient leurs contributions de qualité à égalité avec ces traductions fantaisistes.
La proposition systématique des modérateurs, sorte de sésame universel, est d'appliquer des étiquettes adéquats.
Mais ceci pose 2 problèmes:
1) les phrases valides et non valides restent à égalité visuelle, donc par exemple pour un apprenant qui ne lirait pas les étiquettes (voire qui ne saurait pas les comprendre), elle sont également valides.
2) les tags peuvent être appliqués et supprimés par les modérateurs sans laisser de trace, ce qui ramène au problème de l'indépendance de la modération.
Je fais par ailleurs remarquer qu'il n'est pas non plus acceptable que des modérateurs dont la fonction est, justement, la modération, prennent parti dans le débat et caricaturent l'opinion des contributeurs, voire appellent au meurtre de ceux qui ont une opinion différente d'eux, comme ici http://tatoeba.org/epo/sentences/show/535374
Illustration du problème ici http://tatoeba.org/epo/sentence...90706#comments

A couple of weeks ago or so I noticed that there were only 200 Japanese sentences not translated into English. I asked for a 'Japanese->English translation drive' and actually got that down to 182 (IIRC).
So, today, I've just got it down to 181 sentences from 202. At this rate it should take just under seven years to translate all Japanese sentences into English.

I don’t think it’s a big problem.
Since no one added a translation to these, maybe they're just too hard to translate. :o

[not needed anymore- removed by CK]

> How about the 8,000 plus English sentences not yet translated into Japanese? :-)
Somebody else's problem.

Somebody else's problem that likely won't be fixed... given the current daily ratio of English:Japanese contributions.

How about the 128 298 Japanese sentences not yet translated into French?

It's closer to a hundred now.

So, any chance of getting the broken tags fixed?

yep, but when I will have time, I've spend the few free times I had this weekend, to fix the duplicate script, and a bug when changing the flag of a sentence (it didn't update correctly some internal structures)

Kiu viŝis ĵus pli ol 400 frazojn en Esperanto kaj kial?


I've run the remove duplicates script

so it's why the number of sentences in some languages may have decrease
by the way overall, we have now more than 500 000 sentences ! (515 000 to be exact)
Congratulations to everyone, some months ago I would have never imagine we will reach it so fast. Next step, 1 000 000 :p

tu es sûr que ça a marché ? Parce que j'ai du mal à croire que ça n'aie pas diminué le nombre de phrases anglaises parmi lesquelles je vois évidemment le plus de doublons puisqu'elles sont les plus nombreuses...

oui car ensuite j'ai fait un "select count(*) , text, lang from sentences group by text, lang having count(*) > 1" qui me montre les phrases en double, et il n'en reste plus qu'une dizaine qui ont rajouté entre temps (le script a tourné hier en soirée)
Mais le nombre de phrase anglaise a baissé, après il est vrai que beaucoup des phrases anglaises se ressemblent parfois à un mot près ou à un singulier pluriel près.

Bon, ben au temps pour moi. Tu as sans doute raison que les ressemblances sont illusoires.

Mais il est vrai en tout cas qu'il serait intéressant de voir, surtout pour l'Anglais, le nombre de phrase réellement différentes. Il me semble que dans le même ordre idée, voir un peu la richesse réelle du corpus, CK avait établi des statistiques sur le nombre de mots différents dans le corpus, et la fréquence de certain. Ce qui n'était pas forcément très glorieux (c'est pour cela que dans les versions futures, il nous faudra trouver divers moyens pour favoriser l'ajout de nouvelles phrases, et si possible contenant du nouveau vocabulaire)

Et ça n'est pas simple d'évaluer la notion de "différence". Tatoeba va justement permettre la créativité en matière d'instruments d'analyse...Je suis impatient de voir tout ça !

Do we have a category in which we can write down our idea in a language (this states the idea, not exactly in word using or grammar) and ask the native speaker to translate it into that language? This will be helpful for those whose mother tougue is not popular and they want to learn a popular language.

I'm not sure quite what you mean. Could you give us an actual example?

I think it's somewhat a "request for sentence"
something like "hey folks, I want to know what do English people say when they want to go the cinema and they've missed the first projection, they're at the cinema already, and want to ask when is the next one"
and a nice guy, with a blue-backgrounded avatar will answer by inputing a sentence in tatoeba :p
@aloanguyen is this what you want ?

Sure it is :D

I mean that when a non-native speaker has got the idea but he doesn't know how write down that idea exactly in a language, he can share that idea and someone else helps him to rewrite that idea correctly. Take the English language as an example, a non-native could write: "Life is full of advantages and disadvantages", a native speaker would rewrite: "Life is full of the ups and down"

I've been thinking about this, too. I sometimes come across words or expressions that don't have a usage example, but don't feel confident enough to construct a suitable sentence for Tatoeba. It would be nice to request a sentence that uses word or idiom X.
Maybe a thought for the future if we get a forum. We could have a request board with per-language threads.

Shouldn't there be ways to rate a sentence/translation that has been put up here? I'm already seeing a couple of bogus examples (:

Typically you should post a comment on the sentence in question. If the sentence is not 'owned' you can 'adopt' (own) it and then correct it yourself.
But if you do correct sentences, bear in mind that it's more complicated when they have direct links to translations in several languages.

blay_paul, please tag as
"Azeri":
http://tatoeba.org/eng/sentences/show/532213
"Thai":
http://tatoeba.org/eng/sentences/show/532218
"Wolof":
http://tatoeba.org/eng/sentences/show/532307

I've said something boracasli, so you know what will happen when I will be back...

i want to be informationed about the next update

*informed

Do you speak Wolof, boracasli?

On the statistics page of all contributors, it would be nice if one could restrict the list to the contributors of a certain language.

yep good idea, I've added it to the things we will need to implement on the next version http://www.assembla.com/spaces/tatoeba2/tickets
(by the way having this ticket system open to every members can also be a good idea ^^)

Great, thanks!

Hi. I have a question about strangely formed chinese sentences, like this ones:
http://tatoeba.org/eng/sentences/show/388335
http://tatoeba.org/eng/sentences/show/532677
http://tatoeba.org/eng/sentences/show/532554
I believe it is some bug of former versions of Tatoeba? I'm facing such sentences very often - almost one of every three sentences.
Does new versions of Tatoeba will fix it? Or somebody (may be me?) should fix it manually? If so - what should I do to gain an access to fix it?

Possibly some sort of encoding / IME problem?
You could start a list
http://tatoeba.org/eng/sentences_lists/index
and call it "[@moderator] Encoding problem/mojibake" or something. That way it would be easier to find them later to fix them.

In fact it's a bug from the software we use, see http://tatoeba.org/fre/wall/sho...7#message_2530 :)

I've also found some Chinese sentences that have no transliteration at all, nor simplified version, such as:
http://tatoeba.org/eng/sentences/show/505658
http://tatoeba.org/eng/sentences/show/417338
http://tatoeba.org/eng/sentences/show/417339
Can anything be done about it?

it's the hard version of the bug :s , so it will be solved the same way.

Okay, I'll do it. Thank you.