Profile
Sentences
Vocabulary
Reviews
Lists
Favorites
Comments
Comments on sacredceltic's sentences
Wall messages
Logs
Audio
Transcriptions
Translate sacredceltic's sentences

Si vous voulez vous inspirer, au niveau du développement, vous pouvez utilement regarder le site http://stackoverflow.com/
Ce que je trouve bien sur ce site, c'est le système de « crédits » généralisé.
Chaque action procure une somme de crédits qui permet 2 choses :
1) elle crédibilise le contributeur par l'affichage de ses crédits
2) elle autorise certaines actions qui sont soumises à des paliers
On pourrait considérer, par exemple un système comme suit (qui est déjà partiellement en place, avec la notion de « contributions » qui s'affichent sur les profils mais je ne sais pas s'il fonctionne vraiment et ça ne conditionne rien...)
créer une phrase = 2 points
commenter une phrase = 1 point
traduire une phrase (créer une phrase + 1 lien de traduction) = 3 points
lier 2 traductions = 1 point
recevoir une étiquette OK = 3 points
appliquer une étiquette OK = 1 point
Pour passer de « nouveau venu » à « contributeur », il faudrait avoir accumulé 100 points sur au moins 1 mois.
Pour passer à « contributeur avancé », il faudrait avoir accumulé 10.000 points sur au moins 1 an.

À voir. J'imagine une combinaison de nombre de phrases (plus de 50...) et de durée d'inscription (plus d'un mois...). Il faudrait instaurer un statut de « nouveau venu » qui se transforme automatiquement en statut « contributeur normal » dès qu'on a passé ces critères.
Le problème que je vois, au niveau de la qualité, c'est que très peu de contributeurs étiquettent OK les phrases. Je suis un des rares à le faire en français, et j'avoue que ce n'est pas mon activité principale, étant donné qu'elle n'est pas réciproque. La seule raison pour laquelle il y en a beaucoup en anglais, c'est que CK auto-attribue cette étiquette à ses propres phrases, ce qu'il est, à ma connaissance, le seul à avoir droit.
Si l'étiquetage OK était plus répandu (mais il faudrait alors davantage mobiliser les contributeurs avancés et les gestionnaires...), on pourrait également se baser sur ce critère (plus de 10 phrases OK...), encore que c'est compliqué, parce que j'ai déjà attribué plus de 10 étiquettes OK à des contributeurs dont le français n'est pas la langue natale et qui font par ailleurs plein d'erreurs...
Soit dit en passant, on pourrait conditionner le passage en contributeur avancé, par l'étiquetage OK (ou non OK...) d'une certaine quantité de phrases de sa langue natale. Ça ferait progresser cette classification en même temps que la qualité des phrases (4 yeux valent mieux que 2)

*** Statistiques des phrases selon la langue natale déclarée du contributeur ***
J'ai fait l'analyse de données brutes fournies par CK du nombre de phrases par contributeur et par langue.
Tatoeba compte 2722 contributeurs qui ont déclaré une langue natale (de diverses manières discutables) et qui totalisent 3.766.000 phrases dans des langues vivantes non construites (j'ai exclu les langues mortes et les langues construites)
En analysant la répartition de ces contributeurs en fonction du nombre de contributions par langue vivante non construite et du taux de contribution dans leur langue natale déclarée, j'obtiens les résultats suivants :
Nombre de phrases maximum créées dans une langue / % de contributeurs ayant contribué à plus de 50% dans une langue différente de leur langue déclarée
moins de 50 phrases => 9,83%
moins de 100 phrases => 8,40%
moins de 500 phrases => 7,64%
plus de 500 phrases => 2,88% (12 contributeurs seulement sur 416)
plus de 1000 phrases => 2,32% (6 contributeurs seulement sur 259)
Ceci nous indique que moins un contributeur crée de phrases, plus il y a de chances qu'il en crée majoritairement dans une langue qui n'est pas sa langue natale.
Inversement, plus un contributeur est actif, plus il contribue majoritairement dans sa langue natale.
Comment j'interprète cela :
- Les nouveaux venus ont davantage tendance à jouer avec le service, en expérimentant la création de traductions dans différentes langues.
- Les contributeurs plus massifs, et donc plus aguerris, comprennent mieux les enjeux qualitatifs du service.
Si l'on veut afficher une meilleure qualité, je suggère donc, sur la page d'accueil qui est le premier contact avec les nouveaux venus, de non seulement ne pas afficher les phrases non adoptées, mais de ne pas afficher non plus les phrases des nouveaux venus, qui ont plus de chances de n'être pas des phrases de leur langue natale, et donc présentent un plus grand risque d'erreur. Une sorte de mise en quarantaine.
Ceci devrait permettre de moins dissuader les nouveaux venus qui sont rebutés par des fautes qu'ils constatent dès le premier contact.
Cela devrait s'appliquer non seulement à la phrase qui s'affiche aléatoirement, mais bien sûr aussi à ses traductions.
À savoir, le "champion" toutes catégories a créé des phrases dans 130 langues différentes (je vous laisse en imaginer la qualité), le 2e dans 54.
60 contributeurs ont contribué dans plus de 10 langues vivantes non construites...

Enfin une injustice de réparée et la fin du mythe ridicule des pays « arabes » monolingues, dans lesquels ni l'ethnie arabe ni la langue arabe n'ont pourtant jamais été majoritaires.
Et encore bravo pour le travail que tu as effectué et qui est remarquable !

>We also need to make it very clear to new members that this is not a site similar to websites such a www.lang-8.com where the purpose is to have others correct what you have written in a language you are learning.
It's true that this has always been the big ambiguity of Tatoeba, which, at first, may look as a playing ground for learners and is often perceived as such by newcomers, as a result.
>The Broken Window Theory somewhat applies, I think.
It does very much.

Does it mean that you're going to change the tags on the sentences ?
Otherwise, I can't see why anybody would object to anybody handling lists...or did I miss something ?

> I think it’s rather a political issue.
Tout est politique.

*** Horus se trompe dans les suppressions ***
https://tatoeba.org/fra/sentences/show/3274708
il a supprimé la plus ancienne et gardé la plus récente.
Déjà qu'il s'attribue les traductions, il n'est pas capable de faire son travail de base de dédoublonnage correctement.
Personnellement, je trouve qu'il y a tellement de problèmes avec cette routine que je suis favorable à sa suspension, en attendant des corrections et des tests exhaustifs en environnement de développement.

>I personally don't think just "lack of grammar errors" is enough for an OK tag.
It's funny how a simple tag and judgment such as "OK", or a behaviour such as adopting a sentence can mean so many different things, since they've never been clearly defined.
Personally, my policy is the following : outside of a clear definition (which I might not accept when defined...), I adopt only sentences that "I would say", except under the circumstances that I create a sentence in Tatoeba that I wouldn't say, but which, according to me, needs to be documented on Internet, because it's living but rare or interesting, and/or local, and I have confirmed the proof of its existence with local natives (for instance, I wouldn't say myself a lot of sentences that I tagged "Belgian-French", but I am sure they do exist, and I not only heard them but cross-checked them with locals, asking them to provide examples of use in context.)
But I OK-tag sentences that I know are OK, even though I wouldn't say them myself.
The nuance might seem minor, but that's actually a hell of a difference, because there are lots of sentences in my native language that I know are OK but which I don't use myself.
I don't tag "OK ", though, sentences that I disapprove of, although they might represent some kind of "valid" language...
So I apply a different policy when it comes to adoption and OK-tagging.

>"to snatch" has been in English for about a thousand years, if not more.
English is not that old...
>I think you are reading too much into this.
Precisely not.
First, "Urban" doesn't equate to colloquialisms in my dictionary.
It means "from the city", as its latin urba root points to.
I don't think "snatch" means more "vagina" as a first thought, in cities than in the countryside. Or maybe you think rednecks are ignorant ?
The fact remains, nevertheless, that 4000+ people took the pain, on purpose, to vote up a definition in a dictionary "from the city" that is provocative and very narrow-minded.
There is no reason to think that people would proceed differently on Tatoeba. I know millions of teenagers who would laugh their brains out voting up the most ridiculous sentences, and that would result in a ridiculous exhibition of counter-example sentences, precisely the contrary to what Tatoeba is trying to promote.
Not everybody is satisfied that the definition of "snatch" comes up with "cunt" as the only definition in an online popular dictionary on Internet.
But Okay, you might find it funny (if you're under 25...)
But do you realise that search engines actually take it for granted ?
Well, Tatoeba is the same. When a sentence is wrong, it shows up in Google searches anyway, and people subsequently take it as is.
And Tatoeba is very well indexed by search-engines, since Tatoeba has a serious and consistent purpose that makes it much favoured by these engines (search engines are optimised to downrate inconsistent websites, that are usually redirecting to unwelcome advertising...)
Yesterday, people used to learn languages from books that where edited (ie, corrected). Today, they learn it from Internet, where anything is and will be written, without any correction (just read Wikipedia or Twitter if in doubt...)
I'm not saying we can prevent Internet from being full of crap, this is already hopeless. But at least, we can prevent that the most favoured results from smart search engines are not only crap. Otherwise, I can't tell you at what rate our languages are going to degrade.

Crowd iodiocy is when 4066 people vote up the definition that is not the more complete and accurate. Only 1419 voted up the complete and accurate definition, which ranks only 3d.
That proves brilliantly that the public, on linguistic Internet sites, is not wise, and prefers to crack bad jokes and ridicule the service that is supposed to be rendered.
Hence my conclusion : crowd wisdom is crowd idiocy. QED
Only to you doesn't it look obvious, bizarrely... Logic, you were saying ??

I don't know what you're talking about with your "logic".
The topic here is "crowd wisdom" to be applied to Tatoeba sentences.
I just provided a good exemple of crowd idiocy, in an Internet linguistic service, parallel to what Tatoeba does.

Sure, here is a typical example http://www.urbandictionary.com/...hp?term=snatch
You'll notice that the correct definition is only the 3d, with only 1419 votes up, when the 1st got 4066.
That means that 4066 idiots took the pain to do this.
It's a clear proof that so-called "crowd-wisdom" is just crowd-idiocy. And it's massive.
I can't see why Tatoeba would be different, since the same people use both services...

Bon, finalement, j'ai redémarré ma machine et mon clavier perso semble fonctionner à nouveau. Il doit y avoir quelque chose (un site...) qui a modifié mon clavier en mémoire. C'est bizarre.
Le problème, c'est que j'ai créé plein de phrases avec des espaces insécables à la place des normales.
Une idée de ce que je peux faire pour les changer en masse ?
À ce propos, il y a toujours le problème, dans les phrases françaises, de phrases en double avec version espace insécable ou normale avant les points doubles ou avant et après les guillemets.
Il y a aussi des doubles (et pas qu'en français), avec les apostrophes informatiques (') et les apostrophes typographiques (’), voir celle-ci (′)
Il faudrait normaliser ça. Idéalement, à la source, à l'insertion de la saisie.

Merci, c'est sympa, surtout d'avoir les liens vers les recherches Tatoeba.
On voit qu'il y a un boulot énorme et ça prouve que les phrases de Tatoeba manquent cruellement de variété, en termes de vocabulaire.

Bon, j'ai peut-être une piste, mais je ne comprends pas pourquoi le problème est soudain survenu.
Sur les conseils de Pharamp, j'ai utilisé l'application Mac OSX Ukelele pour personnaliser mon clavier, ce qui me permet d'écrire en plusieurs langues, dont l'espéranto, avec un seul dessin de clavier. Je trouvais ça génial.
J'utilise actuellement la version 10.11.1 d'OSX, El Capitan (qui est vachement mieux que les précédentes, mon Mac connaît une nouvelle jeunesse...) et lorsque j'ai migré mon Mac vers cette version, je n'ai pas noté de changement de comportement dans Tatoeba.
Il semble donc que des mises à jour ultérieures « invisibles » aient changé le comportement du clavier personnalisé.
Lorsque je passe en clavier français standard, le problème semble réglé. Mais pas avec mon clavier personnalisé, qui fonctionnait pourtant à merveille auparavant.
Je pense ne pas être le seul contributeur à employer Ukelele, donc le problème risque de se reproduire pour d'autres.
Les arcanes des mises à jours Apple semblent de plus en plus insondables.
En attendant, je ne peux plus écrire en espéranto. Sniff.

The system, alas, seems not to learn anymore...

Je suis toujours totalement opposé à votre système pseudo-démocratique d'appréciation de la qualité des phrases.
Le fait d'être un administrateur du corpus ou un gestionnaire du corpus n'est pas un gage de qualité, ni non plus que plusieurs contributeurs, par ailleurs peut-être ignorants, approuvent une phrase.
Une phrase est soit correcte ou incorrecte. Ça ne dépend pas de l'appréciation de qui que ce soit. C'est juste un fait.

Vraiment bizarre, parce que je tape avec le même clavier qu'avant, je n'ai rien changé. Comment se fait-il que ce soit désormais considéré comme insécable par Tatoeba ?

*** césure incorrecte sur les phrases de Tatoeba ***
Je remarque, depuis quelques jours, que les mots sont coupés de manière bizarre dans l'éditeur et à l'affichage des phrases de Tatoeba, qui, jusqu'à présent, respectait l'intégrité des mots, qui appraissaient sur une même ligne (quand ils n'étaient pas trop long)
Que se passe-t-il ?
Exemple ci-dessus, dans mon éditeur de commentaires, le mot « apparaissaient » est soudain coupé après ss...