menu
Tatoeba
language
Register Log in
language English
menu
Tatoeba

chevron_right Register

chevron_right Log in

Browse

chevron_right Show random sentence

chevron_right Browse by language

chevron_right Browse by list

chevron_right Browse by tag

chevron_right Browse audio

Community

chevron_right Wall

chevron_right List of all members

chevron_right Languages of members

chevron_right Native speakers

search
clear
swap_horiz
search
paula_guisard paula_guisard October 14, 2011 October 14, 2011 at 8:44:03 PM UTC flag Report link Permalink

I'm not sure if it has already been discussed, but what is the community's opinion on being able to create tags more freely? I mean, for many languages, if we search for a verb, sometimes we are not able to find any matching sentences due to verb conjugation. For example: imagine I'm confused about the use of te expression "to see red" and I write "see red" on the search bar, but the only sentence avaiable is "she SAW red". Then I won't be able to find it. Especially if I don't know that the past of "see" is "saw". Wouldn't it be useful to be able to tag the infinitive form of verbs into our sentences? What does everybody think about it?

{{vm.hiddenReplies[8077] ? 'expand_more' : 'expand_less'}} hide replies show replies
sysko sysko October 14, 2011 October 14, 2011 at 9:08:37 PM UTC flag Report link Permalink

actually it's more about improving the search engine capacity to recognize infinitive form of verbs, because right now an advanced user can create any tags (though normal users can't) without any restriction, rather than improving tagging capacity, otherwise we will would finish with hundrends of thousand tags (number of languages we have * number of verbs in each language) which that will uselessly clutter the tags list.

{{vm.hiddenReplies[8078] ? 'expand_more' : 'expand_less'}} hide replies show replies
paula_guisard paula_guisard October 19, 2011 October 19, 2011 at 7:40:07 PM UTC flag Report link Permalink

Hm, I get it know. Well, it's just that I was actually thinking of a whole new tagging system, different from the one we use today. Instead of having fixed tags that we select from a list, it would work pretty much like a website search engine. Whenever we create a website, we can create tags for them which are included in the search of any search engine. It would pretty much work like that. So, imagine I've got a sentence, like:

> He woke me up

I could include the tages: "wake up; woke up; wake someone up", for example. Whenever the search engine was used, it would look up for the searched term on the sentences as well as on the hidden tags created by the users at the moment of adding up that sentence.

Of course there would have to be a huge effort into changing the search engine. I just though it would be more helpful.

Certainly, it's up to the community, of course. I'm just trying to learn everyone's thoughts on the matter. :)

{{vm.hiddenReplies[8131] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic October 20, 2011 October 20, 2011 at 9:15:45 AM UTC flag Report link Permalink

Cela impliquerait de faire confiance à tous les utilisateurs (y compris les petits plaisantins et les saboteurs) dans leur capacité à étiqueter leurs phrases de manière pertinente...
Ou alors il faudrait, comme pour le contenu des phrases, pouvoir débattre des étiquettes personnelles, ce qui créerait un système parallèle de discussion...

Personnellement, je ne crois pas à la sagesse des foules. Je crois même plutôt à la bêtise crasse des foules, que l'Histoire des hommes nous enseigne abondamment. Les foules ont inventé le Stalinisme, le Nazisme, Le Maoïsme, Les Khmers Rouges, Le génocide arménien, au Rwanda, et plus récemment on a pu voir la foule se marcher dessus lors d'une simple parade en Allemagne (comme ça arrive fréquemment dans tous les stades et lieux publics...)
Coluche, un humoriste français, disait qu'à plus de 2, on est une bande de cons. Je ne suis pas loin de partager cet avis.

Je me suis déjà souvent exprimé sur ce sujet mais, au risque de me répéter, je vais le faire encore une fois :
De même que la mauvaise monnaie chasse la bonne, la mauvaise information chasse la bonne, et c'est vrai aussi des phrases et de leurs traductions.
Donc si on passe assez de temps avec suffisamment de personnes, sachant que les personnes éclairées ou expertes sont une minorité, elles seront toujours débordées par l'ignorance, l'incompétence et la bêtise.
À terme, je prédis même que le nombre de phrases et de traductions erronées sur Tatoeba dépassera le nombre de phrases et de traductions justes. C'est peut-être déjà le cas...
Mais, au moins, grâce aux débats (parfois houleux) la plupart des phrases erronées arrivent plus ou moins, tôt ou tard (plutôt tard) à être corrigées.

Pour les étiquettes personnelles, je serais beaucoup plus dubitatif. Les gens s'y accrocheraient à tout prix et l'indexation deviendrait complètement foireuse.
Tous les sites d'étiquettes « libres » que je connais terminent tous en un ramassis d'étiquettes mal rédigées, pleines de fautes d'orthographes, redondantes, non administrées et au final inexploitables, surtout en plusieurs langues...
Un exemple pour vous en convaincre : http://fr.forvo.com/tags/

Vous pouvez constater que même la liste actuelle des étiquettes Tatoeba, pourtant réservée aux contributeurs confirmés, et plusieurs fois expurgée, est déjà assez bordélique http://tatoeba.org/fre/tags/view_all et la raison en est que, à part pour les étiquettes utilisées pour l'administration des phrases et de leurs corrections, personne ne s'accorde sur ce que devrait être les étiquettes et à quoi elles devraient servir (il n'y a d'ailleurs pas de débat sur ce sujet, car chacun considère le statu quo selon sa propre interprétation.)

{{vm.hiddenReplies[8134] ? 'expand_more' : 'expand_less'}} hide replies show replies
Scott Scott October 20, 2011 October 20, 2011 at 5:08:05 PM UTC flag Report link Permalink

I think that the tag system works pretty well, but tags should be classified. The corpus quality is good in my opinion, though moderators should probably be a bit more active in applying corrections (in French at least).

Here are some of the links for moderators:

http://tatoeba.org/eng/tags/for...e_spelling/eng
http://tatoeba.org/fre/tags/for...rs/@change/eng
http://tatoeba.org/eng/tags/for...ge_grammar/eng

Overall, I agree with sacredceltic that opening the tag system to everyone or having "personal tags" would be a mess.

{{vm.hiddenReplies[8135] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic October 20, 2011 October 20, 2011 at 5:46:07 PM UTC flag Report link Permalink

Il y a actuellement des étiquettes parfaitement inutiles, parce qu'elles n'apportent pas d'information générale aux contributeurs, mais sont utilisées comme codes privés par certains, et qui devraient plutôt faire l'objet de listes...

Le principe des étiquettes, c'est qu'elles sont visibles par tous, et donc leur lecture doit être utile à tous, autrement l'espace public est encombré et ça introduit de la confusion, d'autant qu'elles sont dans une seule langue que tout le monde ne comprend déjà pas forcément...
Toute étiquette qui n'est pas destinée à informer tout le monde et qui ne le fait pas suffisamment clairement (abréviations, mots intraduisibles ou difficilement compréhensibles) devrait donc être retirée et son usage actuel devrait être traité autrement.

{{vm.hiddenReplies[8138] ? 'expand_more' : 'expand_less'}} hide replies show replies
sysko sysko October 20, 2011 October 20, 2011 at 6:09:03 PM UTC flag Report link Permalink

oui dans le nouveau système de tag (j'ai plus en tete s'il est deja utilisable sur tato.sysko.fr(en tout cas je l'ai codé)), ne pourront être ajouté que des tags déjà existants, (il sera bien évidemment possible de me demander (à terme il y a aura un formulaire pour cela, pour automatiser la chose de mon coté))

cela évitera les tags inutiles, les tags redondants, permettra de plus facilement les traduire etc.

beaucoup d'autres (dont ce que proposent l'utilisateur au dessus) passeront sur des champs "métas" qui fonctionneront sur un principe de clé valeur comme suit

clé valeur
auteur Victor Hugo
forme "brut" je avoir mangé un pomme
grammaire S V C

(ce ne sont que des exemples, pas la peine de discuter de leur contenu propre )

{{vm.hiddenReplies[8140] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic October 20, 2011 October 20, 2011 at 6:26:48 PM UTC flag Report link Permalink

L'essentiel, c'est que ça n'encombre pas l'espace visuel. L'intérêt d'une étiquette, c'est bien sûr d'attirer l'attention sur quelque chose d'important (par exemple le fait qu'il s'agit d'une citation ou d'un proverbe, ou d'une rime, et qu'il faut donc en tenir compte pour traduire).

Mais trop d'information tue l'information. S'il y a donc trop d'étiquettes, l'œil n'est plus attiré par l'essentiel et ça entraîne de la confusion chez les nouveaux arrivants qui ne comprennent pas très bien à quoi ça sert...