Wall (6,959 threads)
Tips
Before asking a question, make sure to read the FAQ.
We aim to maintain a healthy atmosphere for civilized discussions. Please read our rules against bad behavior.
sharptoothed
3 days ago
Cangarejo
3 days ago
Cangarejo
6 days ago
Thanuir
6 days ago
ondo
7 days ago
ddnktr
7 days ago
ondo
7 days ago
AlanF_US
11 days ago
Nandixer
12 days ago
cblanken
14 days ago
http://tatoeba.org/deu/tags/sho...s_Native_Check
http://tatoeba.org/deu/tags/sho...s_Native_Check
http://tatoeba.org/deu/tags/sho...d_native_check
should be melted
Where do you get the sentences from?
Many of them were collected by the professor Tanaka.
Many of them were just added by different people.
Ich habe gerade eine StudiVZ-Gruppe namens Tatoeba.org gegründet. VZ-Mitglieder also immer hinein da: http://www.studivz.net/Groups/O...ee80e070614900
Do tags have numerical IDs that can be attributed to language-specific labels? Perhaps tags can be translated in a node-and-link fashion like sentences are!
I mean this instead of having tags being stuck in English.
Yes, they do, but I believe sysko is doing (or planning to do) something about the tags to make them translatable. I was planning to have progressed more on the tags cleanup and getting a discussion going on a number of issues relevant to the topic.
Recently something came up that slowed me down a bit and I'm gradually catching up, but it might still not be until April or May that I'm able to put in any solid hours on this.
An IRC conversation generated this idea:
Let's have specialists in certain areas write sentences about those areas so they can be translated into different languages. It may not even be an official designation--just a way to encourage certain types of people to contribute.
On the sentence contribution page[1] there is a link to CK's Words Not Yet in the Tatoeba[2]. I think this is a great tool for contributors who want to contribute to the database's weaknesses.
Perhaps we could create pages of specialised vocabulary (CK's page has an Academic Word List[3]). There is a database of words and translations at ordabanki.hi.is (the interface is in the Nordic languages, even Greenlandic and Sami, and English ... those bastards) that one could perhaps use to generate specialist word lists. I've just sent an email to the Word bank editor to see if one can download the whole thing.
[1] http://tatoeba.org/eng/sentences/add
[2] http://a4esl.com/temporary/tatoeba/notyet/
[3] http://a4esl.com/temporary/tato...t/eng-awl.html
Here's a click-able link to the Word Bank to make your lives a little easier:
http://ordabanki.hi.is
Heck, I'll even toss in the English interface for free:
http://ordabanki.hi.is/wordbank...WebLanguage=EN
More IRC conversation generated another idea: a MegaHAL-based chatbot for the #tatoeba or a separate IRC channel, fed the entire Tatoeba corpus language by language, perhaps on a weekly or monthly basis. Something that can generate silly sentences for our amusement, inspiration, or even material to add to Tatoeba. It's also a technical thing that Sysko would have to do because Sysko does half of everything.
For languages with few or no native speakers (Esperanto, Lojban, etc.), is there an equivalent for the "@Needs Native Check" tag, or is that tag okay to use even when it's not literally applicable?
It's fine to use it. :-)
Try not to apply it to Esperanto, because it will open a can of worms. Firstly because native speakers of Esperanto don't necessariy have the best command of the language, and also because the idea behind Esperanto is that every sentence which is grammatically correct is acceptable, no matter how strange it may sound to some ears. The actual test for an Esperanto sentence is whether someone from a different language background than the writer understands the sentence.
>or no native speakers (Esperanto, Lojban, etc.),
There are native speakers of Esperanto...
>Nevertheless i think that it's fine to use the "@Needs Native Check" tag, because there probably wont be many real native esperanto speakers here (i guess). So the tag implies what you just mentioned: "@Needs Check by a speaker from another country" but it would be to complicated to use this tag.
The community of Esperanto speakers on Tatoeba is probably the most diverse of all. Esperanto is actually bridging many different languages on Tatoeba that would otherwise probably remain unbridged for years. So there's no need for such a tag, since esperanto sentences are being exhaustively and constantly reviewed...If you want to retrieve non-native mistakes, concentrate on Globish, it's full of them...
ho, mi certe respektas la rolon de esperanto ĉi tie. Mi celis, ke kvankam ja ekzistas denaskaj esperantistoj, la plejparto de esperanto-uzantoj ĉi tie ne estas denaskaj, do la ununura problemo estus se ekzemple hazarde germana Esperantisto kontrolas Esperantan frazon de germana Esperantisto: Tiam eblus ke ambaŭ eraras samlingve.
The only problem could be that two users of the same native language check on each others Esperanto sentences: that way they could both err in the same way, due to their native language.
sed fakte, ĉe Tatoeba, estas esperanto parolantoj ekde multaj landoj. Pli ol iu alia lingvo...
jes, tio ne estas tro versxajna. Sed gxi igxas iom pli versxajna pro samtempeco: Se mi kutime kontribuas vespere estas ankaux vespere por aliaj samlingvaj kontribuantoj kiuj ankaux sxatas kontribui cxe cxi tiu tempo de la tago. Tamen oni ja ne nur kontrolas novajn frazojn, do ne estas tro versxajne :)
Yes, that is why I said "few or no native speakers". Esperanto has few. Lojban has none.
Nevertheless i think that it's fine to use the "@Needs Native Check" tag, because there probably wont be many real native esperanto speakers here (i guess). So the tag implies what you just mentioned: "@Needs Check by a speaker from another country" but it would be to complicated to use this tag.
Well, actually, the same can be said of native speakers of any language.
This was discussed a while back in some detail and alternatives for the title of this tag discussed. "@sentence check", "@grammar check", "@proficient speaker check" or something like that. There was no consensus so we just settled on leaving it for the time being.
The idea being that users with "trusted user" status realised that the tag was for marking sentences that needed to be checked by someone proficient enough to know whether the sentence was correct enough -- and able to judge the limits of their proficiency (a trickier task than one might expect; it's those unknown unknowns).
So, if you're fine with using a tag that's not literally correct, just continue to use "@Needs Native Check". If you don't, we can also reopen this naming discussion ... though that's another can of worms.
I completely agree with Swift, that is fine to use it by my side ;)
Fucongcong a détruit ma phrase 784420 en arguant que c'est un "duplicate" (pas de traduction compréhensible pour les francophones...) de la phrase777512, mais ça n'est pas le cas...Evidemment, je ne peux rien y faire que le reporter ici...
En règle général, je trouve que très peu d'attention est portée à la suppression de supposés doubles et inversement à l'attachement de traductions pourtant distinctes.
Je préconise qu'aucune suppression ne soit opérée sans le consentement du propriétaire, ce qui pose de toutes façons des problèmes de licence...
Ah désolée, je me suis trompée. J'ai zappé la nuance entre tes deux phrases. J'y ferai plus attention la prochaine fois.
Peux-tu rajouter ta phrase comme traduction pour la phrase allemande, stp ?
http://tatoeba.org/chi/sentences/show/777513
ben non, je ne peux pas faire ça. Si tu ne le sais pas, demande à sysko, il va t'expliquer...
en plus, le champ permettant de consulter une phrase par son numéro semble avoir désormais disparu, si bien que je ne sais même pas consulter ma propre phrase supprimée...
Vu l'historique, je pense que c'était une traduction de la phrase allemande. On ne peut pas retrouver ta phrase supprimée, mais on peut la retraduire. Voici le lien de la phrase allemande :
http://tatoeba.org/chi/sentences/show/777513
c'est fait, mais je ne trouve pas normal qu'on ne puisse restaurer les phrases supprimées par erreur. Là il n'y avait pas de commentaires, mais si c'était le cas, ils seraient perdus, sans compter tous les liens évventuels...
mais je confirme que les commentaires sont perdues (dans l'absolu on a une sauvegarde de la base toute les semaines, donc on pourrait toujours retrouver ceux-ci, delta qu'ils datent d'au moins la semaine passé), idem je vais repenser cela quand je m'occuperai de remettre la fonctionnalité de commentaires.
au tenmps pour moi on avait corrigé cela, les commentaires sont toujours gardé et accessible sur la page de la phrase (ce sont les étiquettes et l'appartenance aux listes qui sont perdus )
ouais, donc c'est la merde. Donc en attendant, il faudrait être plus que prudent quand vous supprimez des phrases...
Pourquoi, c'est la merde? Pourquoi ne codes-tu pas ce que tu voudrais?
?
Bah sysko a beaucoup mieux expliqué ce que je voulais dire.
Bah, tu ne devrais pas te mêler des conversations des grandes personnes dans des langues que tu ne maîtrises pas et que tu ne prends pas la peine de lire correctement...
;) ;) ;)
:D :D :D
:P
parce que toi, tu te trouves "respectful" en m'invitant, en coordination avec ton copain Swift à aller me faire voir ailleurs ? Moi je trouve ça très grossier de ta part. Chacun voit le respect à sa fenêtre...
> ouais, donc c'est la merde
soit.
Excuse-moi de remarquer un problème...
ce n'était pas dans le fond. Je suis d'accord que le système est très loin d'être parfait, qu'il y a eu des erreurs de faites lors de conception, erreur que nous payons maintenant car rattraper le tir maintenant n'est plus aussi simple que si on l'avait corriger avant. Je n'ai contre non plus que tu fasses remarquer les dysfonctionnements et que même que tu t'en indignes, Trang et moi ne pensons pas être omniscient même sur notre propre travail, et certaines erreurs / défauts peuvent nous échapper, après pour l'indignation (peut-être pas l'adjectif le plus approprié, mais je ne trouve pas de mots plus proche pour le moment, ça va me revenir) , ok idem, on ne donne pas peut être la bonne priorité à chaque tâche, peut-être certaines devraient être traiter avant d'autre etc.
Tout cela d'accord,
Mais dès lors "c'est de la merde", non là je ne vois pas, ce n'est ni constructif, ni poli, ni respectueux. Peut-être lors de nos premiers échanges je n'ai pas non plus fait part de la plus grande courtoisie, mais ça ne semble pas une justification à continuer dans la lancé.
là, tu commets une erreur d'analyse syntaxique: Relis bien ce que j'ai écris...
....es-tu bien sûr que j'avais écrit un "de" entre "c'est" et "la merde" ?
Es-tu bien sûr que "c'est la merde" a le même sens que "c'est de la merde" ?
Tu sais bien que non.
Je conçois que tu puisses avoir eu une journée fatigante et que je vous tape sur les nerfs et que Pharamp et Swift m'invitent de manière coordonnée à aller me faire voir ailleurs, mais tu sais bien, toi, que "c'est la merde" signifie en français que l'on constate simplement qu'il y a un problème dont on a pas pour l'instant la solution, et c'est très différent de dire qu'on pense que ce qui cause le problème est "de la merde"...
Voici une nouvelle preuve édifiante que les gens lisent ce qu'ils veulent bien lire. On lit ce qu'on veut lire, avec le contexte qu'on a en tête, et non celui qui est indiqué...
Une belle leçon de texte, dans tous les cas...
>Je conçois que tu puisses avoir eu une journée fatigante
Exact, il est 6h du matin sur mon fuseau horaire et je ne suis pas couché (à prendre au sens premier du terme)
là dessus mes plus plates excuses, en effet je pense que mon inconscient (surement la dominante noire de ton avatar qui par mes origines occidental me fait associer sacredceltic => noir , noir => mal , sacredceltic => mal) m'a joué un tour.
en effet c'est la merde.
ouais mon avatar ne joue pas en ma faveur, je sais. Ma nationalité non plus d'ailleurs. Ni mon âge. Ni le fait que j'aime pas les émoticons. Mais ce qui tue, c'est que j'ai le front de demander l'équité linguistique. Ça, ça dépasse l'entendement et il faut absolument tout faire pour me faire taire !
Imagine un peu : Une espèce de vioque franchouillard avec une sale gueule, qui refuse obstinément de mettre des pastilles d'ecstasy plein ses messages et qui ose se plaindre en plus ! Non mais des fois !
Il ne manquerait plus que tu habites en Belgique.
ouais, c'est un cauchemar...
Merci !
C'est vrai que c'est une fonctionnalité manquante. Il faut le voir avec Trang ou Sysko.
Les modérateurs n'ont pas le pouvoir de le faire, mais je pense que sysko pourrait opérer sur le database de façon de restaurer n'importe quelle phrase. Il faut lui demander ça, mais j'imagine que oui, c'est possible.
Oui je suis d'accord que l'on devrait pouvoir le faire, à l'heure actuelle ce n'est pas facilement possible d'avoir une telle fonctionnalité de manière automatique à cause d'une erreur de conception, qui rend ardu la chose. Cependant nous avons l'historique complet des changements, donc oui il m'est tout à fait possible sur demande de restaurer une phrase et des liens.
D'ailleurs la semaine dernière j'ai codé le système d'historique de la nouvelle version, de manière à permettre facilement des retours en arrière en cas d'erreurs, même s'il y a eu des modifications encore après.
I need to have this translated into as many languages as possible:
http://tatoeba.org/eng/sentences/show/785667
I'm going to add this message somewhere on the Wall. It wouldn't make sense to tell people they can write in any language in a language they don't understand.
What is the best tag for sentences that have British English punctuation styles? There is one for Mr/Mr., but specifically I'm wondering what I should do for quotes. (American English puts punctuation inside quotes, British English on the outside.)
Here are a few:
http://martin.swift.is/tatoeba/...ml#orthography
If you don't like "spelling" for cases of punctuation, you can create a new tag for that.