menu
Tatoeba
language
Zaregistrovat se Přihlásit se
language Čeština
menu
Tatoeba

chevron_right Zaregistrovat se

chevron_right Přihlásit se

Prohlížet věty

chevron_right Náhodná věta

chevron_right Podle jazyka

chevron_right Podle seznamů

chevron_right Podle štítků

chevron_right Podle nahrávek

Komunita

chevron_right Zeď

chevron_right Seznam všech členů

chevron_right Jazyky členů

chevron_right Rodilí mluvčí

search
clear
swap_horiz
search
sysko {{ icon }} keyboard_arrow_right

Profil

keyboard_arrow_right

Věty

keyboard_arrow_right

Slovíčka

keyboard_arrow_right

Provedená hodnocení

keyboard_arrow_right

Seznamy

keyboard_arrow_right

Oblíbené

keyboard_arrow_right

Komentáře

keyboard_arrow_right

Komentáře u vět uživatele sysko

keyboard_arrow_right

Zprávy na Zdi

keyboard_arrow_right

Záznamy

keyboard_arrow_right

Audio

keyboard_arrow_right

Přepisy

translate

Překládat věty uživatele sysko

Zprávy uživatele sysko na Zdi (celkem 1 397)

sysko sysko 11. prosince 2011 11. prosince 2011 18:09:22 UTC link Trvalý odkaz (permalink)

I've temporaly removed "Auto dectection" as anyway it's not working right now, in the mean time I've started thinking about coding my own one, as it seems there's no good open source out of there to do this. Basically I think to use the current tatoeba database to create some kind of 3-gram stats table by languages, and after do a magic algorithm that will calculate a score when you submit a sentence, and will choose the language with the highest score.

(for reuse purpose it will be something independant from tatoeba, I mean it will be a standalone service, though here in tatoeba we will still use it transparently)

So I will maybe also take the advantage of coding this to , if i've time / if really needed, to permit users who want to enter the language they contribute him, in order for the system to not wrongly detect a sentence has spanish for soemone who contribute only in French , Shanghainese and Chinese.

sysko sysko 9. prosince 2011 9. prosince 2011 0:11:03 UTC link Trvalý odkaz (permalink)

actually I've done a quick debug and discovered that this page was doing actually a heavy request on the database, and with the current load on the website, timeouted before being accomplished (and in the meantime increased even more the already high load).

So waiting me to put a cache on this page, I will desactivate this one.

sysko sysko 7. prosince 2011 7. prosince 2011 19:44:59 UTC link Trvalý odkaz (permalink)

Ok I've put a correction, actually as I've said with Sacredceltic, the problem is that the language detection rely on a API provided by Google, as actually very few tools permit to do this.

And seems today Google has removed this functionnaly, or at least limited the access. So for the moment autodetect will set the sentence as unknown, waiting to find something to replace google API.

sysko sysko 7. prosince 2011 7. prosince 2011 16:46:43 UTC link Trvalý odkaz (permalink)

but the problem is solved now,no?

sysko sysko 7. prosince 2011 7. prosince 2011 14:45:36 UTC link Trvalý odkaz (permalink)

oui, mettre la langue en inconnu, et de mon coté faire que cela inscrit dans les logs que le service google est tombé.

sysko sysko 7. prosince 2011 7. prosince 2011 14:39:52 UTC link Trvalý odkaz (permalink)

et c'est quand je reviens que le problème disparaît .... car bon ça aurait été trop simple si j'avais eu le temps de voir la cause exacte, histoire de proposer un correctif pérenne...

ça me rappelle quand je donne cours, les problèmes des élèves disparaissent comme par magie quand je m'approche de leur ordinateur, quand bien même ils avaient réellement un problème.
C'est un peu le don de thaumaturgie à la sauce Tatoeba.

sysko sysko 7. prosince 2011 7. prosince 2011 14:34:46 UTC link Trvalý odkaz (permalink)

en fait pour le coup, ce ne serai du coup pas si bizarre, pour la détection automatique de langue, il n'y avait pas (encore maintenant?) d'outil efficace libre pour faire cela sur autant de langue et de tres court echantillons, du coup cela passe par une API de google. Donc du coup si l'url à changer où s'ils ont arrêté le service, ceci expliquerait cela.

Je regarde cela.

sysko sysko 7. prosince 2011 7. prosince 2011 14:11:12 UTC link Trvalý odkaz (permalink)

Same problem for me

BUT , when I choose directly the language , not autodetect, I can add,

can others confirm this ?

sysko sysko 7. prosince 2011 7. prosince 2011 13:56:48 UTC link Trvalý odkaz (permalink)

yep sorry for this, the problem have happened at the beginning of my working day so I see the messages only know. And Murphy law oblige, it's during my busiest days that all these problems happen ...

I'm starting to investigate this

sysko sysko 4. prosince 2011 4. prosince 2011 18:59:53 UTC link Trvalý odkaz (permalink)

should be fixed by now.

sysko sysko 30. listopadu 2011 30. listopadu 2011 18:06:28 UTC link Trvalý odkaz (permalink)

[fra] Ce qui est intéressant c'est de voir c'est que ce sont les langues les plus communes de tatoeba qui sont en proportion le moins traduit, sûrement que lorsqu'une personne contribue dans une langue "rare", elle le fait souvent soit en traduisant seulement, soit en ajoutant puis en traduisant peu de temps après.
Alors que les contributeurs dans les langues assez bien représentées sur Tatoeba prennent plus de liberté, ayant surement à l'esprit "De toute manières quelqu'un finira par me traduire"

Bon ça enfonce un peu des portes ouvertes mon analyse...

sysko sysko 30. listopadu 2011 30. listopadu 2011 7:28:54 UTC link Trvalý odkaz (permalink)

I willl have time to restore them around friday, not before, but at the end it will be done

No that was not normal, as any crash anyway. It happends because of the conjonction of boracasli stuff and (and actually mainly this), the fact that google suddenly decided to crawl our website with a 5 request by second rate, so Tatoeba simply said "no I can't, or you should give me a raise" and goes on strike.

but don't worry we get backup of the data so at the end everything will get back to normal.

sysko sysko 29. listopadu 2011 29. listopadu 2011 19:35:12 UTC link Trvalý odkaz (permalink)

Yep I don't think this account is a fake one from bora, my bora-fake-account-detector-3000-next-gen-deluxe-edition(tm) has recognized no "bora"-like pattern in his behaviour.

sysko sysko 29. listopadu 2011 29. listopadu 2011 18:44:26 UTC link Trvalý odkaz (permalink)

This user seems to leave and answer to comment, so may be drop him so comment on the languages in which he has added sentences that he hasn't added in his profile.

sysko sysko 28. listopadu 2011 28. listopadu 2011 18:29:55 UTC link Trvalý odkaz (permalink)

Don't worry for this :) Actually I've started working on this issue this weekend, but the internet connection there make the task much much slower. But in the end it will get fix, data are backup often enough.

sysko sysko 26. listopadu 2011 26. listopadu 2011 12:56:52 UTC link Trvalý odkaz (permalink)

On the way to fix everything...

sysko sysko 25. listopadu 2011 25. listopadu 2011 6:28:56 UTC link Trvalý odkaz (permalink)

Pour la premiere fois c'etait du au petit crash qy'il y a eu il y a 3/4 jours , du coup la table de stats etait plus synchronisé, et la c'est redescendu car j'ai enfin trouvé le temps de faire un script pour supprimer de façon propre et rapide les 238 comptes de bora et les phrases associés.

sysko sysko 21. listopadu 2011 21. listopadu 2011 18:15:25 UTC link Trvalý odkaz (permalink)

what a coincidence, just before I planned to go to sleep ....

sysko sysko 18. listopadu 2011 18. listopadu 2011 18:33:05 UTC link Trvalý odkaz (permalink)

oui, quelque jours a relacher mon attention, et paf, j'ai blacklisté sa nouvelle adresse IP, on devrait être tranquille quelque jours. Va falloir que je me fasse un petit script pour supprimer de manière propre toutes traces d'un utilisateur, comme s'il n'avait jamais existé. Histoire de supprimer plus rapidement les avatars de l'ami bora et leurs contributions délétères

sysko sysko 16. listopadu 2011 16. listopadu 2011 17:21:28 UTC link Trvalý odkaz (permalink)

... as for example I've recorded some of Sacredceltic's sentences