sacredceltic's Дивардагы хәбәрләр

sacredceltic {{ icon }}

keyboard_arrow_right

Профиле

keyboard_arrow_right

Җөмләләр

keyboard_arrow_right

Сүз саклыклыгы

keyboard_arrow_right

Күзәтү

keyboard_arrow_right

Исемлек

keyboard_arrow_right

Сайланганнар

keyboard_arrow_right

Шәрехләр

keyboard_arrow_right

sacredceltic's җөмләләренә шәрехләр бирә

keyboard_arrow_right

Дивардагы хәбәрләр

keyboard_arrow_right

Логлар

keyboard_arrow_right

Аудио

keyboard_arrow_right

Транскрипцияләр

translate

Җөмләләрне тәрҗемә итү sacredceltic

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 17:55:51 UTC

link

Даими сылтама

> many people identify more flags than language codes.

And more than a few do it wrongly.

On the benefits side, Tatoeba would avoid low quality contributions that are only motivated by flags ranking...

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 17:37:03 UTC

link

Даими сылтама

With the language code and away with this silly nationalism !

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 12:58:37 UTC

link

Даими сылтама

No the Union Jack is not the right flag for the English language, because other languages do exist in the United Kingdom, and equating the nation with its dominant language is just demeaning towards its minority language speakers.

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 11:20:46 UTC

link

Даими сылтама

You should also tell Arnold
https://tatoeba.org/fra/sentences/show/450604

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 11:12:17 UTC

link

Даими сылтама

It’s just factual...I can’t put it otherwise...

sacredceltic 1 декабрь, 2019 ел 1 декабрь, 2019 ел, 11:00:04 UTC

link

Даими сылтама

> Does the suggestion I made on this issue make sense to people?

No it doesn’t. It’s been years you don’t understand this problem, but we don’t need you to understand it as long as it is solved by people who do.
The reasons why you don’t understand it is because you take Internet typographic rules for granted and universal. They’re not to be taken so.
US admins shouldn’t be part of this debate because they just don’t get it. It’s hopeless to explain it to them. And that is why US developers should have nothing to do with the elaboration of the CSS of an international website such as Tatoeba.
Each time they’re in charge, on any international website, they create havoc with the typography of other languages and the sites end up looking americanised and juvenilised.

sacredceltic 20 октябрь, 2019 ел 20 октябрь, 2019 ел, 13:18:17 UTC

link

Даими сылтама

Mais, personnellement, je ne comprends pas non plus à l’oral un Québécois de Gaspésie, mais à l’écrit, je peux pourtant le lire...

sacredceltic 20 октябрь, 2019 ел 20 октябрь, 2019 ел, 9:44:10 UTC

link

Даими сылтама

Bonjour. Pour ma gouverne, lorsque l’on dit que l’état algérien a reconnu officiellement la langue berbère, on ne parle donc pas du kabyle ?
N’étant pas spécialiste, j’aimerais comprendre s’il est vraiment dans l’intérêt de la langue berbère, dont le nombre de locuteurs n’atteint pas les 10millions, de se présenter dans tatoeba comme un groupe de langues se subdivisant, plutôt que comme une langue unique ? La majorité des phrases ne sont-elles pas communes ? Partant, pourquoi ne pas faire comme pour l’anglais ou le français et simplement indiquer les variantes régionales par des étiquettes d’information ?
Je pense que certains états, dont fait partie l’Algérie, ont un intérêt politique à subdiviser les minorités linguistiques afin de les affaiblir. C’est typiquement ce que les Russes ont fait en Moldavie, initialement une région de langue roumaine, en prétendant que sa langue est différente du roumain après avoir tout fait pour la russifier pendant 50 ans d’occupation...

sacredceltic 20 октябрь, 2019 ел 20 октябрь, 2019 ел, 9:19:23 UTC

link

Даими сылтама

Qu’est un « utilisateur dans le rouge » ?

sacredceltic 28 апрель, 2019 ел, редакцияләнгән 14 май, 2019 ел 28 апрель, 2019 ел, 8:34:52 UTC, редакцияләнгән 14 май, 2019 ел, 19:02:16 UTC

link

Даими сылтама

You’re confusing sentences "by members" and sentences "owned by members".
It's not the same thing.
Many sentences have been adopted by members because they had no owner or the former owner unowned them.
Actually, a number of sentences have unknown contributors.

sacredceltic 25 апрель, 2019 ел 25 апрель, 2019 ел, 19:41:43 UTC

link

Даими сылтама

Je ne peux pas dire que j’aie « stressé « le système, mais je l’ai testé avec quelques phrases courtes, qui sont les plus difficiles à reconnaître par ce type de technique, et avec du vocabulaire non standard.
Je dois dire que je suis très satisfait du résultat. C’est très efficace. Je n’ai eu aucune erreur.
Donc merci beaucoup pour le résultat parfait !
Il reste à tester avec d’autres langues, mais pour le français, c’est redoutable !
Bravo !

sacredceltic 23 апрель, 2019 ел 23 апрель, 2019 ел, 15:47:04 UTC

link

Даими сылтама

Merci de t’en être occupé.
Je comprends que les 10% du corpus, ce n’est qu’un essai.
Le plus, le mieux. Idéalement il faudrait utiliser la totalité du corpus, en tout cas les phrases écrites par des locuteurs dont c’est la langue natale ( enfin celle qu’ils déclarent avoir...)
Et il faudrait une mécanique qui permette sa réactualisation permanente (sysko avait prévu ce truc, dans ma mémoire, mais ça n'avait peut-être jamais été mis en œuvre...)
Ça n’a pas besoin d’être du temps réel. Un bon traitement hebdomadaire ferait l’affaire.
Donc sans être du « profond », ce serait quand même de l’apprentissage...

sacredceltic 9 апрель, 2019 ел 9 апрель, 2019 ел, 11:25:40 UTC

link

Даими сылтама

*** matérialisation des traductions directes /indirectes ***

La plupart des nouveaux utilisateurs continuent à confondre les traductions directes et indirectes, malgré les différentes couleurs de flèches (bleue ou grise)
Ça pose de graves problèmes de compréhension du site et ça génère des commentaires intempestifs, parfois agressifs...
Je propose une amélioration pour mieux matérialiser l’indirection :
Ne peut-on pas, en plus des couleurs de flèches, INDENTER l’affichage des traductions indirectes ?

sacredceltic 6 апрель, 2019 ел 6 апрель, 2019 ел, 18:12:14 UTC

link

Даими сылтама

Je serais ravi de participer à tous les tests en la matière.
Je trouve ce sujet passionnant et je me demande si d'autres services, sur Internet, ont ce besoin. Je pense que c'est une besoin émergeant. Et il faudrait envisager de recourir à de l'IA, du "deep learning", de la même manière qu'on apprend à des systèmes à reconnaître des visages.
Je pense qu'il serait intéressant de demander à Google de l'assistance en la matière. Je suis convaincu qu'ils prêteraient leur aide, car ils doivent considérer le projet Tatoeba comme intéressant et prometteur, et donc avec bienveillance.
Mais, en attendant, je trouvais la piste prise par sysko très intéressante. D'ailleurs, les probabilités, c'est la base de ce sur quoi s'appuie le "deep learning" pour dire qu'une photo est celle d'un visage ou pas.
La connaissance est rarement algorithmique. Elle est plutôt cumulative.

sacredceltic 6 апрель, 2019 ел 6 апрель, 2019 ел, 16:28:33 UTC

link

Даими сылтама

Bonjour.

J'avais déjà signalé ici il y a quelques temps que je trouvais que l'identification automatique de langues semblait moins bien fonctionner qu'auparavant.

Là, je viens d'introduire la phrase « La stupidité n'est pas une excuse » et elle a été identifiée comme de l'italien.
Ca semble extravagant.
Dans mon souvenir, le système d'identification mis en place par sysko, reposait sur une analyse statistique de sections de 3 ou 4 lettres des phrases de chaque langue, permettant d'établir un score de probabilité.
J'avais participé à l'évaluation de ce système, et il était très efficace, en tout cas pour les langues pour lesquelles Tatoeba disposait d'une quantité suffisante pour servir de base statistique.
Or si on décompose ma phrase en sections de 3 ou 4 lettres, on tombe sur des sections qui sont quasiment toutes hautement improbables en italien :
"La stupidità non è una scusa"
J'ai donc bien peur que le système ait été changé pour un système bien moins performant qu'auparavant...

sacredceltic 19 февраль, 2019 ел 19 февраль, 2019 ел, 19:01:17 UTC

link

Даими сылтама

Magnifique exemple de génuflexion face à la pression de la RPC !
La définition chinoise de “terroriste” est : non approuvé par le Parti communiste chinois et la race Han, seule digne de commander les autres ethnies inférieures (selon leur définition, c’est à dire juste plus numériquement faible...) du territoire de la RPC.
C’est comme ça qu’ils ont interné toute la jeunesse ouïgour dans des camps de rééducation, comme ils font avec les Tibétains, quand ils ne frappent pas leurs moines à coups de crosse dans les lamasseries...
Le peuple ouïgour, comme le peuple tibétain, fait preuve d’un courage exemplaire face à une dictature sanguinaire, qui n’a rien à envier au nazisme. Il mérite le drapeau de son choix, pas celui imposé par son impitoyable oppresseur.

sacredceltic 10 гыйнвар, 2019 ел, редакцияләнгән 10 гыйнвар, 2019 ел 10 гыйнвар, 2019 ел, 18:26:39 UTC, редакцияләнгән 10 гыйнвар, 2019 ел, 18:27:31 UTC

link

Даими сылтама

Bon, là c’est de pire en pire : des phrases françaises assez longues sont reconnues comme de l’anglais (!) ou de l’interlingua.
Je pense qu’il ne peut s’agir que d’un canular...

sacredceltic 6 гыйнвар, 2019 ел 6 гыйнвар, 2019 ел, 13:47:39 UTC

link

Даими сылтама

cette phrase-ci vient d'être identifiée comme de l'émilien...
https://tatoeba.org/fra/sentences/show/7699792

sacredceltic 6 гыйнвар, 2019 ел 6 гыйнвар, 2019 ел, 13:44:05 UTC

link

Даими сылтама

A peu près toutes les dernières phrases courtes en français que j'ai créées ont été mal identifiées comme des langues improbables : chavanaco, bavarois,...
Donc je soupçonne que c'est le faible échantillonnage de ces langues qui les fait être détectées comme candidates...

sacredceltic 5 гыйнвар, 2019 ел 5 гыйнвар, 2019 ел, 14:45:18 UTC

link

Даими сылтама

La reconnaissance automatique de langue est polluée par des langues dont le nombre de phrases est faible.
Je pense qu'il faudrait exclure de la reconnaissance les langues qui n'ont pas encore atteint une certaine masse de phrases, de manière à ce que l'algorithme d'identification puisse s'appuyer sur des échantillons plus significatifs de segments.

Берәр ярдәм кирәкме?

Җитештерүчеләр

Проект турында

Дивардагы sacredceltic's хәбәрләре (барлыгы 2 658)

Берәр ярдәм кирәкме?

Җитештерүчеләр

Проект турында