menu
Tatoeba
language
Nýskráning Innskrá
language Íslenska
menu
Tatoeba

chevron_right Nýskráning

chevron_right Innskrá

Vafra

chevron_right Sýna setningu af handahófi

chevron_right Vafra eftir tungumáli

chevron_right Vafra eftir lista

chevron_right Vafra eftir merki

chevron_right Vafra upptökum

Samfélag

chevron_right Veggur

chevron_right Meðlimalisti

chevron_right Listi tungumála meðlima

chevron_right Innfæddir

search
clear
swap_horiz
search
sacredceltic {{ icon }} keyboard_arrow_right

Notandasíða

keyboard_arrow_right

Setningar

keyboard_arrow_right

Orðaforði

keyboard_arrow_right

Dómar

keyboard_arrow_right

Listar

keyboard_arrow_right

Eftirlæti

keyboard_arrow_right

Ummæli

keyboard_arrow_right

Ummæli á setningum frá sacredceltic

keyboard_arrow_right

Veggskilaboð

keyboard_arrow_right

Saga

keyboard_arrow_right

Upptökur

keyboard_arrow_right

Umritunir

translate

Þýða setningar frá sacredceltic

Veggskilaboð frá sacredceltic (samtals 2.648)

sacredceltic sacredceltic 25. apríl 2019 25. apríl 2019 kl. 19:41:43 UTC link Tengill

Je ne peux pas dire que j’aie « stressé «  le système, mais je l’ai testé avec quelques phrases courtes, qui sont les plus difficiles à reconnaître par ce type de technique, et avec du vocabulaire non standard.
Je dois dire que je suis très satisfait du résultat. C’est très efficace. Je n’ai eu aucune erreur.
Donc merci beaucoup pour le résultat parfait !
Il reste à tester avec d’autres langues, mais pour le français, c’est redoutable !
Bravo !

sacredceltic sacredceltic 23. apríl 2019 23. apríl 2019 kl. 15:47:04 UTC link Tengill

Merci de t’en être occupé.
Je comprends que les 10% du corpus, ce n’est qu’un essai.
Le plus, le mieux. Idéalement il faudrait utiliser la totalité du corpus, en tout cas les phrases écrites par des locuteurs dont c’est la langue natale ( enfin celle qu’ils déclarent avoir...)
Et il faudrait une mécanique qui permette sa réactualisation permanente (sysko avait prévu ce truc, dans ma mémoire, mais ça n'avait peut-être jamais été mis en œuvre...)
Ça n’a pas besoin d’être du temps réel. Un bon traitement hebdomadaire ferait l’affaire.
Donc sans être du « profond », ce serait quand même de l’apprentissage...

sacredceltic sacredceltic 9. apríl 2019 9. apríl 2019 kl. 11:25:40 UTC link Tengill

*** matérialisation des traductions directes /indirectes ***

La plupart des nouveaux utilisateurs continuent à confondre les traductions directes et indirectes, malgré les différentes couleurs de flèches (bleue ou grise)
Ça pose de graves problèmes de compréhension du site et ça génère des commentaires intempestifs, parfois agressifs...
Je propose une amélioration pour mieux matérialiser l’indirection :
Ne peut-on pas, en plus des couleurs de flèches, INDENTER l’affichage des traductions indirectes ?

sacredceltic sacredceltic 6. apríl 2019 6. apríl 2019 kl. 18:12:14 UTC link Tengill

Je serais ravi de participer à tous les tests en la matière.
Je trouve ce sujet passionnant et je me demande si d'autres services, sur Internet, ont ce besoin. Je pense que c'est une besoin émergeant. Et il faudrait envisager de recourir à de l'IA, du "deep learning", de la même manière qu'on apprend à des systèmes à reconnaître des visages.
Je pense qu'il serait intéressant de demander à Google de l'assistance en la matière. Je suis convaincu qu'ils prêteraient leur aide, car ils doivent considérer le projet Tatoeba comme intéressant et prometteur, et donc avec bienveillance.
Mais, en attendant, je trouvais la piste prise par sysko très intéressante. D'ailleurs, les probabilités, c'est la base de ce sur quoi s'appuie le "deep learning" pour dire qu'une photo est celle d'un visage ou pas.
La connaissance est rarement algorithmique. Elle est plutôt cumulative.

sacredceltic sacredceltic 6. apríl 2019 6. apríl 2019 kl. 16:28:33 UTC link Tengill

Bonjour.

J'avais déjà signalé ici il y a quelques temps que je trouvais que l'identification automatique de langues semblait moins bien fonctionner qu'auparavant.

Là, je viens d'introduire la phrase « La stupidité n'est pas une excuse » et elle a été identifiée comme de l'italien.
Ca semble extravagant.
Dans mon souvenir, le système d'identification mis en place par sysko, reposait sur une analyse statistique de sections de 3 ou 4 lettres des phrases de chaque langue, permettant d'établir un score de probabilité.
J'avais participé à l'évaluation de ce système, et il était très efficace, en tout cas pour les langues pour lesquelles Tatoeba disposait d'une quantité suffisante pour servir de base statistique.
Or si on décompose ma phrase en sections de 3 ou 4 lettres, on tombe sur des sections qui sont quasiment toutes hautement improbables en italien :
"La stupidità non è una scusa"
J'ai donc bien peur que le système ait été changé pour un système bien moins performant qu'auparavant...

sacredceltic sacredceltic 19. febrúar 2019 19. febrúar 2019 kl. 19:01:17 UTC link Tengill

Magnifique exemple de génuflexion face à la pression de la RPC !
La définition chinoise de “terroriste” est : non approuvé par le Parti communiste chinois et la race Han, seule digne de commander les autres ethnies inférieures (selon leur définition, c’est à dire juste plus numériquement faible...) du territoire de la RPC.
C’est comme ça qu’ils ont interné toute la jeunesse ouïgour dans des camps de rééducation, comme ils font avec les Tibétains, quand ils ne frappent pas leurs moines à coups de crosse dans les lamasseries...
Le peuple ouïgour, comme le peuple tibétain, fait preuve d’un courage exemplaire face à une dictature sanguinaire, qui n’a rien à envier au nazisme. Il mérite le drapeau de son choix, pas celui imposé par son impitoyable oppresseur.

sacredceltic sacredceltic 10. janúar 2019 — breytt 10. janúar 2019 10. janúar 2019 kl. 18:26:39 UTC — breytt 10. janúar 2019 kl. 18:27:31 UTC link Tengill

Bon, là c’est de pire en pire : des phrases françaises assez longues sont reconnues comme de l’anglais (!) ou de l’interlingua.
Je pense qu’il ne peut s’agir que d’un canular...

sacredceltic sacredceltic 6. janúar 2019 6. janúar 2019 kl. 13:47:39 UTC link Tengill

cette phrase-ci vient d'être identifiée comme de l'émilien...
https://tatoeba.org/fra/sentences/show/7699792

sacredceltic sacredceltic 6. janúar 2019 6. janúar 2019 kl. 13:44:05 UTC link Tengill

A peu près toutes les dernières phrases courtes en français que j'ai créées ont été mal identifiées comme des langues improbables : chavanaco, bavarois,...
Donc je soupçonne que c'est le faible échantillonnage de ces langues qui les fait être détectées comme candidates...

sacredceltic sacredceltic 5. janúar 2019 5. janúar 2019 kl. 14:45:18 UTC link Tengill

La reconnaissance automatique de langue est polluée par des langues dont le nombre de phrases est faible.
Je pense qu'il faudrait exclure de la reconnaissance les langues qui n'ont pas encore atteint une certaine masse de phrases, de manière à ce que l'algorithme d'identification puisse s'appuyer sur des échantillons plus significatifs de segments.

sacredceltic sacredceltic 22. mars 2018 22. mars 2018 kl. 10:49:43 UTC link Tengill

So the wording is improper. They're not inactive, they're de-activated...

sacredceltic sacredceltic 21. mars 2018 21. mars 2018 kl. 23:14:12 UTC link Tengill

What do you mean they're "inactive" ? How is that defined ? Because Shakespeare is dead, his verses may be stolen and perverted at will ?

sacredceltic sacredceltic 29. nóvember 2016 29. nóvember 2016 kl. 11:08:02 UTC link Tengill

Non, je parle de Tatoeba : la page d'accueil qui montre le palmarés des langues et affiche les 5 premiers drapeaux.

sacredceltic sacredceltic 27. nóvember 2016 27. nóvember 2016 kl. 22:11:31 UTC link Tengill

Au vu de la qualité lamentable de certaines phrases, je remets ce sujet CRUCIAL à l'ordre du jour...

sacredceltic sacredceltic 27. nóvember 2016 27. nóvember 2016 kl. 22:05:46 UTC link Tengill

Again, I'm DEMANDING why I am being censored for STATING A MERE FACT...
PLEASE authorities that censored me, I DARE YOU TO EXPLAIN HERE what Tatoeba principle I TRAMPLED !

sacredceltic sacredceltic 27. nóvember 2016 27. nóvember 2016 kl. 13:04:27 UTC link Tengill

I wonder what, in the mere FACT that I was reporting, goes against Tatoeba rules...

sacredceltic sacredceltic 26. nóvember 2016 — breytt 26. nóvember 2016 26. nóvember 2016 kl. 09:28:01 UTC — breytt 26. nóvember 2016 kl. 09:28:37 UTC link Tengill

the correct way to avoid such a mess in the future is the following :

1) Check that a contributor UNDERSTANDS the UI before granting them the privilege to destroy other contributors' patient work.

2) add tooltips to the linking/unlinking buttons clearly explaining what they mean and do.

sacredceltic sacredceltic 26. nóvember 2016 — breytt 26. nóvember 2016 26. nóvember 2016 kl. 09:17:25 UTC — breytt 26. nóvember 2016 kl. 09:19:41 UTC link Tengill

so you have unlinked, since the time you became an advanced contributor, dozens or even hundreds of patiently elaborated translations that were perfectly valid like here https://tatoeba.org/fra/sentences/show/1042481
This is absolutely shameful and I DEMAND that you immediately relink them ALL.
You are not proficient in French and you don't know the meaning of what you read in this language, so PLEASE STOP linking or unlinking translations in this language !
I don't get why you became an advanced contributor, which enabled you to destroy the work of other contributors !
Why on earth is the mastery of languages and the understanding of the service UI not a prerequisite to becoming advanced contributor ? That is beyond me !

sacredceltic sacredceltic 24. nóvember 2016 24. nóvember 2016 kl. 08:07:51 UTC link Tengill

>A good example sentence should be helpful and provide enough context to show how to use it.

If we are to follow this principle, 90% of sentences should be deleted. Even a "Yes" requires context...
I won't abide by this principle.

23. nóvember 2016 — breytt 25. nóvember 2016 23. nóvember 2016 kl. 22:47:12 UTC — breytt 25. nóvember 2016 kl. 03:44:57 UTC link Tengill
warning

The content of this message goes against our rules and was therefore hidden. It is displayed only to admins and to the author of the message.