menu
Tatoeba
language
S'inscriure Connexion
language Occitan
menu
Tatoeba

chevron_right S'inscriure

chevron_right Connexion

Percórrer

chevron_right Afichar la frasa aleatòria

chevron_right Percórrer per lenga

chevron_right Percórrer per lista

chevron_right Percórrer per etiqueta

chevron_right Percórrer los enregistraments àudio

Community

chevron_right Paret

chevron_right Lista de totes los membres

chevron_right Languages of members

chevron_right Native speakers

search
clear
swap_horiz
search
sacredceltic sacredceltic April 21, 2021 April 21, 2021 at 8:02:25 PM UTC flag Report link Permalink

Sans réponse à ma demande d’explication quant à la censure dont ma précédente publication a été l’objet, je tente à nouveau ma chance, car je voudrais vraiment comprendre ce qui a été censuré. Ça me semble totalement arbitraire...

Donc j’y disais qu’il serait intéressant de mesurer le taux de proximité de deux langues, par exemple le « moldave » et le roumain, en mesurant le pourcentage de phrases Tatoeba qui sont identiques, en ignorant la casse et la ponctuation, entre les corpus de ces 2 langues.

Je serais particulièrement intéressé par les taux d’identité entre le « kabyle » et le berbère ou entre le « bosnien «  et le croate, entre autres, mais je suis bien convaincu que de nombreux autres membres seront intéressés par d’autres paires de langues, dont les différences sont encore plus exotiques...

Dans l’idéal, il faudrait également pouvoir ignorer le type d’écriture. Évidemment c’est plus compliqué...

{{vm.hiddenReplies[36892] ? 'expand_more' : 'expand_less'}} hide replies show replies
Thanuir Thanuir April 22, 2021 April 22, 2021 at 4:53:56 AM UTC flag Report link Permalink

Tämä olisi vaikeaa jo sen takia, että kielet eivät ole yksi-yhteen -suhteessa toisiinsa.

Helpompaa olisi varmaan kysyä, että kuinka monella kielen A lauseella on täysin vastaava (poislukien välimerkit ja isot alkukirjaimet tai mitä nyt ikinä) käännös kielessä B. Se olisi periaatteessa mahdollista selvittää, mutta kertoisi lähinnä, että kielen A otos Tatoebassa on osajoukko kielen B otoksesta.

Jos tästä haluaa symmetrisen mitan, voi mittaa käyttää molempiin suuntiin. Mutta tulos kertoisi silti enemmän Tatoebasta kuin kielistä.

Tämä taitaa olla yksi niitä asioita, että jos se kiinnostaa, pitää se tehdä itse.

Igider Igider April 22, 2021, edited April 23, 2021 April 22, 2021 at 1:42:36 PM UTC, edited April 23, 2021 at 4:14:52 PM UTC flag Report link Permalink

Oh mon pauvre cette censure n'est rien à côté de la suppression du drapeau Kabyle, le symbole de tout un peuple (car quel kabyle qui serait contre la souveraineté de son territoire ? Contre sa propre existence ?) !

Tu n'auras aucune réponse ! Car ironiquement le fait de répondre, ou de censurer est un acte politique !

On nous l'a supprimé seulement parce qu'un contributeur "mascotte" a pleurniché 3 secondes car le drapeau kabyle porte atteinte à son unité nationale algérienne "arabe et musulmane" (voir la constitution algérienne) et ça blessait son magnifique égo.

Malgré le quasi soutien des contributeurs kabyles eh bien il a suffit de 3 chats "berbères" (algériens, il faut le préciser et d'origine kabyle de surcroît), pour que notre honorable drapeau soit supprimé sans aucune autre forme de procès !

;-)

NB : Le 20 Avril a été commémoré qu'en Kabylie, pourtant il est dit "Printemps berbère".
https://vava-innova.com/article...de-la-kabylie/

Les policiers colonialistes algériens qui essayaient d'intimider des milliers de souverainistes kabyles 20/04/2021 : https://www.youtube.com/watch?v=8FXgtIkkdf8

Ce message sera censuré ! LOL

{{vm.hiddenReplies[36894] ? 'expand_more' : 'expand_less'}} hide replies show replies
Yagurten Yagurten April 22, 2021 April 22, 2021 at 5:52:37 PM UTC flag Report link Permalink

Excuse me but I think that such comments should not be tolerated on the wall. I see too many insults and provocation. I am Kabyle myself but also Algerian, so show some respect please. If you don't want to be Algerian, fine, but stop insulting Algeria and its people in front of this website's international audience. It's such a shame and people doing so are only making fools of themselves.

{{vm.hiddenReplies[36896] ? 'expand_more' : 'expand_less'}} hide replies show replies
Ricardo14 Ricardo14 April 23, 2021 April 23, 2021 at 2:52:49 PM UTC flag Report link Permalink

+1

We should focus on translating and adding sentences. Besides, it's supposed that we're mature adults.

{{vm.hiddenReplies[36897] ? 'expand_more' : 'expand_less'}} hide replies show replies
Yagurten Yagurten April 23, 2021 April 23, 2021 at 6:04:23 PM UTC flag Report link Permalink

+1 Well said, Ricardo14. Thank you.

QAzaqQA QAzaqQA April 26, 2021 April 26, 2021 at 2:52:14 PM UTC flag Report link Permalink

@Ricardo14 Can the addition of new languages be made simpler?

{{vm.hiddenReplies[36912] ? 'expand_more' : 'expand_less'}} hide replies show replies
Ricardo14 Ricardo14 April 26, 2021, edited April 26, 2021 April 26, 2021 at 4:57:20 PM UTC, edited April 26, 2021 at 6:01:07 PM UTC flag Report link Permalink

Actually many people requested language using this "method" and it worked. It *doesn't* mean that there's room for improvement, but we need to know how can we do it. For that, we (also) have to answer some of those questions

What have the requesters struggled on requesting languages?
Is this process too bureaucratic or should it be even more? Why?
Are we failing on having a close approach to the language requesters?

{{vm.hiddenReplies[36914] ? 'expand_more' : 'expand_less'}} hide replies show replies
QAzaqQA QAzaqQA April 26, 2021, edited April 26, 2021 April 26, 2021 at 6:23:34 PM UTC, edited April 26, 2021 at 6:24:18 PM UTC flag Report link Permalink

It is very bureaucratic to send an email to Tatoeba Language Team and it woud be better to link Github Language request so that a message automatically comes to Tatoeba Language Team so that just list and Github request would be enough.

{{vm.hiddenReplies[36915] ? 'expand_more' : 'expand_less'}} hide replies show replies
Ricardo14 Ricardo14 April 26, 2021 April 26, 2021 at 6:37:35 PM UTC flag Report link Permalink

We need to assure that we have good sentences, that the language icon (aka flag is appropriated), etc. Unfortunately, some bureaucracy is needed but again, there's room for improvement. Again, we'd need to know why/if is that too annoying and how. We'd need a good description about this matter.

{{vm.hiddenReplies[36916] ? 'expand_more' : 'expand_less'}} hide replies show replies
QAzaqQA QAzaqQA April 26, 2021 April 26, 2021 at 6:41:12 PM UTC flag Report link Permalink

Github already gets language requests and the email would have the same information so sending email would be double the work when Github already gets the requests.

{{vm.hiddenReplies[36917] ? 'expand_more' : 'expand_less'}} hide replies show replies
gillux gillux April 26, 2021 April 26, 2021 at 7:28:16 PM UTC flag Report link Permalink

Github is primarily used by developers to write code. Developers don’t have the skill to process language requests, that’s why the language team should be contacted first. They make sure that everything’s fine (language icon, sentences, naming etc.), and only then they create the relevant Github issue so that developers can implement the new language in the code.

{{vm.hiddenReplies[36920] ? 'expand_more' : 'expand_less'}} hide replies show replies
QAzaqQA QAzaqQA April 26, 2021 April 26, 2021 at 7:37:55 PM UTC flag Report link Permalink

I got this but @Ricardo14 is closing language requests made properly.

{{vm.hiddenReplies[36923] ? 'expand_more' : 'expand_less'}} hide replies show replies
gillux gillux April 26, 2021 April 26, 2021 at 7:41:00 PM UTC flag Report link Permalink

These were closed because you did not contact the language team first.

{{vm.hiddenReplies[36924] ? 'expand_more' : 'expand_less'}} hide replies show replies
QAzaqQA QAzaqQA April 26, 2021 April 26, 2021 at 7:49:39 PM UTC flag Report link Permalink

The Language team was contacted first for many requests but still they were removed.

QAzaqQA QAzaqQA April 27, 2021 April 27, 2021 at 2:08:16 PM UTC flag Report link Permalink

Why did you close independent requests by a new account in Tatoeba Github?

gillux gillux April 26, 2021 April 26, 2021 at 7:37:50 PM UTC flag Report link Permalink

I believe it’s easier to send an email than to open a Github issue (not to mention creating a Github account and figuring out how to open an issue).

No matter whether the language requests would be initially made through Github or email, they need to be reviewed by the language team.

QAzaqQA QAzaqQA April 27, 2021, edited April 27, 2021 April 27, 2021 at 2:10:23 PM UTC, edited April 27, 2021 at 2:12:12 PM UTC flag Report link Permalink

There are some very biased people here in Tatoeba. Just like how your flag was not added to Kabyle, even requests for other Amazigh Languages are not entertained here by these biased people. Take Care @Igider.

{{vm.hiddenReplies[36936] ? 'expand_more' : 'expand_less'}} hide replies show replies
Igider Igider April 28, 2021, edited April 28, 2021 April 28, 2021 at 8:50:35 AM UTC, edited April 28, 2021 at 8:55:37 AM UTC flag Report link Permalink

Indeed my dear @QAzaqQA unfortunately what you say is the reality. Tatoeba doesn't look for the accuracy of the information for ideological reasons, but prefers to be in cahoots with some zealous people. Frankly, remove a flag by simple request of an individual belonging to another language? In spite of a hundred Kabyle contributors?... it is the height of injustice.

Moreover this person does not respect any Berber language by treating them as dialects and mixing them to create an undrinkable soup by all Berbers (Algeria, Morocco, Libya, Egypt, Canary Islands, Tunisia ...) !

The worst thing is that the administrators of Tatoeba put this individual on a pedestal.

Thank you for your understanding, it is very rare. Take care of yourself too.

{{vm.hiddenReplies[36946] ? 'expand_more' : 'expand_less'}} hide replies show replies
QAzaqQA QAzaqQA April 28, 2021 April 28, 2021 at 8:54:31 AM UTC flag Report link Permalink

@Igider I face problems to add languages like Nafusi, Riffian, Tuareg, Central Atlas Tamazight and Mozabite languages which actually have sentences in Tatoeba. Thanks for your understanding.

{{vm.hiddenReplies[36947] ? 'expand_more' : 'expand_less'}} hide replies show replies
Igider Igider April 28, 2021, edited April 28, 2021 April 28, 2021 at 8:58:50 AM UTC, edited April 28, 2021 at 9:14:59 AM UTC flag Report link Permalink

@QAzaqQA

Your approach is scientific because each Berber people has its own language! So logically and fairly they must have their own symbols (flag, transcription, ....). Thank you for your relevant and scientific contribution.

The Berber flag is a unifying flag of all Berbers! To mix them is to harm them and so not respecting them.

It's like putting a European flag for English, French,... I don't think American, English or French contributors would approve that! Imagine if on top of that we mix these languages and we will say that it is the European language!

Unfortunately, lies are always one step ahead of the truth! That is politics! And that is ignorance!

In a few months, we will be asked to forgive...

Good luck !

Cabo Cabo April 22, 2021 April 22, 2021 at 2:17:04 PM UTC flag Report link Permalink

The sample is too little.

{{vm.hiddenReplies[36895] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic April 23, 2021 April 23, 2021 at 8:20:27 PM UTC flag Report link Permalink

You want to mean it’s too small...

gillux gillux April 23, 2021 April 23, 2021 at 6:22:57 PM UTC flag Report link Permalink

Ce serait intéressant effectivement. Peut-être faisable avec Tatoeba-playground: https://github.com/agrodet/Tatoeba-playground

{{vm.hiddenReplies[36899] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic April 23, 2021 April 23, 2021 at 7:03:30 PM UTC flag Report link Permalink

Ah merci Gillux, enfin quelqu’un qui comprend de quoi je parle et de l’intérêt que ça peut avoir ! Peut-être as-tu une idée de pourquoi ma requête précédente, sur ce même sujet, a été censurée et par qui ?
Aujourd’hui, entre Xi, Vladimir, et Recep, il y a une telle surenchère de censure qu’on n’est plus sûr de rien 😉

{{vm.hiddenReplies[36900] ? 'expand_more' : 'expand_less'}} hide replies show replies
gillux gillux April 23, 2021 April 23, 2021 at 7:06:40 PM UTC flag Report link Permalink

Non, je n’en sais rien.

{{vm.hiddenReplies[36901] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic April 23, 2021 April 23, 2021 at 7:10:50 PM UTC flag Report link Permalink

Et tu ne trouves pas ça inquiétant qu’il y ait une sorte de Big Brother qui censure des publications sans que tu saches pourquoi ?

{{vm.hiddenReplies[36902] ? 'expand_more' : 'expand_less'}} hide replies show replies
gillux gillux April 23, 2021 April 23, 2021 at 7:39:35 PM UTC flag Report link Permalink

Non, car je pars du principe que les gens sont de bonne volonté. Je crois que nous avons des opinions assez différentes à ce sujet et je n’ai pas envie de poursuivre ce débat avec toi. Si tu le veux bien, revenons-en au calcul de la similitude entre les langues. Je pense que ce calcul serait intéressant pour créer une sorte de nuage de langues, où les langues proches seraient rassemblées en grappes. Ou encore, pouvoir suggérer des langues à apprendre aux polyglottes, genre "si vous connaissez les langues x et y, alors la langue la plus facile à apprendre pour vous est z"

Mais bon, je pense que je rêve un peu car comme le dit Thanuir, l’analyse en dira toujours plus sur Tatoeba que sur les langues elles-même. Cabo pense aussi que l’échantillon est trop petit.

En plus, si on se limite à une bête comparaison des caractères, comme tu le suggères dans ton message initial, l’analyse serait très simple mais très limitée. Il faudrait aussi et surtout analyser selon d’autres critères comme la syntaxe (ordre des mots), la grammaire (je pense au coréen et au japonais qui sont très proches grammaticalement mais éloignés graphiquement), le vocabulaire (si un mot est transparent d’une langue à l’autre mais que la syntaxe est différente, pas évident de faire le lien)…

{{vm.hiddenReplies[36903] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic April 23, 2021 April 23, 2021 at 8:17:01 PM UTC flag Report link Permalink

La censure n’est jamais « de bonne volonté ».
Elle a toujours une motivation, rarement avouable ...

Mais je suis bien content que tu t’intéresses à ce sujet, qui est vraiment intéressant !
Tu as raison sur les limites. Je le vois de la même manière : il faut dépasser la graphie, la syntaxe, la grammaire...que de projets d’études linguistiques !

{{vm.hiddenReplies[36904] ? 'expand_more' : 'expand_less'}} hide replies show replies
gillux gillux April 24, 2021 April 24, 2021 at 1:31:13 AM UTC flag Report link Permalink

Voici une piste théorique : https://fr.wikipedia.org/wiki/Word_embedding

TRANG TRANG April 29, 2021 April 29, 2021 at 7:15:36 PM UTC flag Report link Permalink

> Sans réponse à ma demande d’explication quant à la censure dont ma
> précédente publication a été l’objet, je tente à nouveau ma chance, car je
> voudrais vraiment comprendre ce qui a été censuré.

Juste pour info, j'ai enlevé la censure. En lisant les messages, je ne comprends pas non plus pourquoi ça a été censuré, mais c'est un autre sujet.

{{vm.hiddenReplies[36957] ? 'expand_more' : 'expand_less'}} hide replies show replies
sacredceltic sacredceltic April 29, 2021 April 29, 2021 at 8:55:21 PM UTC flag Report link Permalink

Ben NON, justement, ce n’est pas un AUTRE SUJET. Il y a des apprentis dictateurs parmi les ADMINISTRATEURS de Tatoeba qui TERRORISENT les contributeurs en s’arrogeant les droits de SUPPRIMER des commentaires et des phrases sans raison.
Tatoeba est devenu une ZONE DE NON DROIT.
Réagissez !!!

sacredceltic sacredceltic April 29, 2021 April 29, 2021 at 9:00:54 PM UTC flag Report link Permalink

Et pour commencer, vous devriez exclure de l’administration des Corpus des gens qui sont en fait des MILITANTS LINGUISTIQUES. Administrer un corpus nécessite de la RAISON et de la TEMPÉRANCE, pas du MILITANTISME...