menu
تاتیبہ
language
رجسٹر لاگ ان
language سرائیکی
menu
تاتیبہ

chevron_right رجسٹر

chevron_right لاگ ان

براؤز

chevron_right رینڈم جملے ݙکھاؤ

chevron_right زبان نال براؤز کرو

chevron_right تندیر نال براؤز کرو

chevron_right ٹیگ نال براؤز کرو

chevron_right آڈیو براؤز کرو

برادری

chevron_right وال

chevron_right سارے ممبراں دی تندیر

chevron_right ممبراں دیاں زباناں

chevron_right مقامی ٻولݨ آ لے

search
clear
swap_horiz
search
sysko {{ icon }} keyboard_arrow_right

پروفائل

keyboard_arrow_right

جملے

keyboard_arrow_right

ژخیرہ الفاظ

keyboard_arrow_right

ریویو

keyboard_arrow_right

تندیراں

keyboard_arrow_right

پسنداں

keyboard_arrow_right

تبصرے

keyboard_arrow_right

sysko دے جملیاں تے تبصرے

keyboard_arrow_right

وال سنیہے

keyboard_arrow_right

لوگو

keyboard_arrow_right

آڈیو

keyboard_arrow_right

نقلاں

translate

sysko دے جملیاں دا ترجمہ کرو

وال (کل 1397) تے syskoدا سنیہا

sysko sysko March 26, 2011 March 26, 2011 at 2:38:41 AM UTC link پرمالنک

Dans le cas d'une base de donnée SQL, oui il y a une limite du fait de la nature même du langage. C'est avec cela en tête que l'on a fait notre propre serveur de base de donnée pour avoir quelque chose convenant à nos besoin. Dès lors notre base ne se base plus sur une représentation en table, mais une representation en graphe, et nous pouvons dès lors effectué une recherche de type BFS http://fr.wikipedia.org/wiki/Al...urs_en_largeur qui nous retourne l'ensemble de l'îlot de phrase sous forme d'un arbre.
Ce qui permet d'aller très très loin (en théorie aucune limite), et de remarquer par exemple que de traduction en traduction, certains phrases "bateaux" comme "ça va?" peuvent devenir "t'as un problème ?" au bout de 20 traductions successives tout en voyant la dite chaine de traduction (ce que ne permet pas le système actuel, ou l'on ne sait pas lorsque l'on a une traduction indirecte d'affichée, par quelle traduction directe elle est reliée à la phrase-pivot)

Évidemment cela ne résouds pas le problème entièrement, mais cela facilite le travail de liage, vu qu'il n'y aura plus besoin de sauter de lien en lien.

(donc pour ce qui est dit au dessus c'est déjà "possible" et codé, il me manque d'autres parties pour pouvoir remplacer tatoeba par cette nouvelle version, mais ça avance plutôt bien, à présent j'ai également un moteur de recherche qui indexe en temps réel etc.)

Après (là c'est de l'hypothétique rien de codé pour l'instant) je peux aussi essayer de représenter en "dur" ces îlots de phrases, de façon par exemple à pouvoir rechercher tous les îlots contenants une phrase en français mais pas de phrases en Allemand, ou les îlots ayant une phrase allemande mais n'étant une traduction directe d'une phrase française du dit îlot. Cela dans le premier cas permettrait de trouver plus facilement des "phrases" (indépendant de la langue, mais je ne trouve pas de mot pour l'instant pour dire cela) nouvelles à traduire, et dans le deuxième des phrases à lier. Encore une fois grâce au système évoqué en premier, avoir ensuite tout sur une page, facilitant grandement la tâche.

En l'état actuel de mes compétences en informatique, je n'ai que ça à proposer que je puisse ou ai réalisé pour vous aider, après évidemment si on pouvait avoir un algo magique (je dis magique car je n'ai aucune idée de comment le faire autrement que dans les grandes lignes), permettant de trouver des phrases similaires.


sysko sysko March 25, 2011 March 25, 2011 at 5:57:16 PM UTC link پرمالنک

they will meet half way.

sysko sysko March 24, 2011 March 24, 2011 at 8:07:42 PM UTC link پرمالنک

+1

sysko sysko March 22, 2011 March 22, 2011 at 7:20:22 PM UTC link پرمالنک

CC-By is for "data", not suitable for code

The code is under AGPL, so basically it's open source, your modifications must stay under a AGPL compatible licence, and you must provide the source if you do a website derived from Tatoeba.

sysko sysko March 19, 2011 March 19, 2011 at 2:32:16 PM UTC link پرمالنک

[eng] I've uploaded the audio of BraveSentry, 1300 German sentences

[fra] Je viens de mettre les audios de BraveSentry, 1300 phrases en allemand

sysko sysko March 14, 2011 March 14, 2011 at 12:30:40 PM UTC link پرمالنک

Sacredceltic est aux faux faux préceptes de sagesse chinoise ce que l'aigle de la montagne au regard perçant est au brebis galeuses sillonnant 3 fois le chemin sinueux de la sagesse éclairé de la faible lueur de la lune de la vérité.

(bon après ça marche uniquement si tu ne t'es pas rasé ce matin si j'ai bien compris.)

sysko sysko March 14, 2011 March 14, 2011 at 11:55:25 AM UTC link پرمالنک

Donc ce sont des faux faux préceptes de sagesse chinoises, mais où va le monde.

sysko sysko March 14, 2011 March 14, 2011 at 11:52:36 AM UTC link پرمالنک

Oui désolé pour le délai, en fait il faut savoir que cela de notre coté se fait en trois étapes,
on génére d'abord le fichier contenant les parties du sites à traduire
on mets le tout sur le site de launchpad
Les gens en suite traduisent
Launchpad tout les un ou deux jours génère le fichier de traduction que l'on peut ensuite remettre sur le serveur.

Donc en fait souvent le décalage qu'il peut y avoir vient du délai de launchpad, après c'est un moindre mal en comparaison des avantages qu'offre la plateforme.

Si certaines parties restes malgré tout en anglais il se peut parfois que nous ayons oublié de marquer certains passages comme étant à traduire. Où parfois Trang choisit délibérément de ne pas rendre certains passages traduisibles car ils ne sont pas finalisés etc.

sysko sysko March 13, 2011 March 13, 2011 at 3:03:01 PM UTC link پرمالنک

oui évidemment des briques existent déjà ici et par là. Par exemple pour le français et ses conjugaisons nous avons la "libverbiste" (basé sur le très bon logicielle open source "verbiste" ) etc.

De plus je développe en ce moment même un projet de dictionnaire reprenant les grandes lignes de tatoeba (pas de langue "principal" etc.) se basant sur les dictionnaires libres déjà existant (en fait la principal motivation pour ce projet est justement de centraliser un peu cela, car par exemple à l'heure actuelle il y a un projet chinois->français ,chinois->anglais, chinois->allemand, mais qui ne collabore pratiquement pas ensemble, utilise des outils inadéquats etc. ) De plus ce projet de par sa conception actuelle, permet de facilement ajouter des métas informations aux mots (classe grammticale, genre etc.) de manière à pouvoir facilement être exploitable par d'autres logicielles.

Car il faut savoir que l'extracteur actuelle se base en fait sur des régles empiriques (il prend un mot s'il finis par "ons" mais pas pas "issons" alors il va en déduire que la racine est -ons +er etc., je simplifie mais c'est le principe, dès lors tu vois les limites de la chose)

Donc en fait non, les langues sont un peu un parent pauvre du libre malheureusement. L'idée serait donc en s'appuyant sur ce projet (qui lui même s'appuierait sur les ressources libres déjà accumulé mais éparpillés aux quatres vents ou sous des formes très difficilement exploitable de manière automatiques) de pouvoir agrandir cette base de donnée sur les mots à l'aide de personne n'ayant pas forcément de connaissance en informatiques, moi de mon coté m'occupant avec qui le voudra de la partie exploitation de la chose.

L'idée serait de pouvoir à terme un extracteur plus intelligent, c'est à dire qui pour deviner la racine, va non seulement appliquer les règles empiriques pour la déduire, mais pourra ensuite s'appuyer sur cette base de connaissance pour voir si d'une cette racine existe et deux si à partir de cette racine et en appliquant les différentes régles de flexions (en s'appuyant sur les métas informations du mots, si cette racine est un verbe du premier groupe, ou un adjectif invariable etc.) voir si on peut retomber sur le mot d'origine.

Évidemment je n'en suis pas encore là et je n'ai pour l'instant que le temps de réfléchir à comment je verrai la chose, et le moment venu, le libre évoluant relativement vite, je regarderai si entre temps aucun projet n'est apparu /a évolué. Le cas échéant je me joindrai à eux plutot que de réinventer la roue de mon coté pour ne pas blesser mon égo. C'est d'ailleurs de cette manière que j'avais rejoins Tatoeba.

sysko sysko March 13, 2011 March 13, 2011 at 2:31:42 PM UTC link پرمالنک

oui avant je me demandais ce que je pourrais coder pour m'exercer. Maintenant avec tatoeba et ce qui gravitent autour, toutes mes soirées d'hivers près du feu sont déjà prises.

sysko sysko March 13, 2011 March 13, 2011 at 11:31:29 AM UTC link پرمالنک

le "stemmer" (aucune idée de comment on traduit cela en français, un lemmatisateur ?), le logiciel qui se charge de dire "mangeons" c'est en fait manger, est très spartiate et ne gère pas très très bien le français. Là dessus je pense que lorsque j'aurai fini la nouvelle version, je m'attellerai à remplacer ce logicielle par un "fait maison".

sysko sysko March 13, 2011 March 13, 2011 at 10:38:06 AM UTC link پرمالنک

voila l'ensemble des phrases concernées sont maintenant "trouvable" via la recherche. Trang est en train de voir pour un correctif définitif.

sysko sysko March 13, 2011 March 13, 2011 at 10:29:12 AM UTC link پرمالنک

J'avoue ne jamais avoir eu le temps de me plonger dans les méandres du moteur de recherche pour voir comment celui-ci analyse une requête donnée, mais peut être parce que le point d'exclamation à un sens pour lui ?
J'émets cette hypothèse car dans ce genre de cas l'usage de guillemets résolvent le problème
http://tatoeba.org/fre/sentence...rom=und&to=und

sysko sysko March 13, 2011 March 13, 2011 at 9:54:09 AM UTC link پرمالنک

Merci de l'avoir signalé, je viens d'y jeter un coup d'œil, c'est visiblement un bug lorsque l'on change la langue d'une phrase, un des champs dans la base est remis à NULL ce qui fait que le moteur de recherche ne la voit plus. On va tâcher de corriger cela au plus vite (une petite centaine de phrases sont affectés)

sysko sysko March 12, 2011 March 12, 2011 at 11:23:17 PM UTC link پرمالنک

The language is chosen by the information send by the browser, which send in the header an ordered list of prefered languages. So we take the first one if it also present in our supported GUI languages, otherwise we choose the default one (we've chosen English, arbitrary choice, as it's easier to google translate it (than esperanto) etc.)

So for example even if i'm in China, as my browser is French, when I'm not logged in tatoeba, it choose French

sysko sysko March 12, 2011 March 12, 2011 at 10:14:13 AM UTC link پرمالنک

http://tatoeba.org/chi/sentences/show/457318
[fra] Visiblement c'était un doublon que le modérateur à relié ensuite à en juger l'historique, cependant je suis d'accord que même dans ce cas, on devrait préciser le motif de la suppression afin de ne pas laisser penser à une suppression purement arbitraire

[eng] Seems the sentence was a duplicate and looking to the logs, the translations were relinked after to the version that has been kept. But I agree we shouldn't delete a sentence without precising why.

sysko sysko March 11, 2011 March 11, 2011 at 10:50:01 PM UTC link پرمالنک

[cmn]现在中文超过了两万句句子,谢谢martha,谢谢fucongcong,nickyeow等等,你们真给力\o/
[eng]Chinese has now more than 20,000 sentences, thanks to martha, fucongcong, nickyeow and all the others, you're all really geili
[fra]Il y a maintenant plus de 20 000 phrases en chinois, merci à martha, fucongcong, nickyeow, vous êtes tous très geili.

sysko sysko March 9, 2011 March 9, 2011 at 11:30:51 PM UTC link پرمالنک

Il ne manquerait plus que tu habites en Belgique.

sysko sysko March 9, 2011 March 9, 2011 at 11:20:18 PM UTC link پرمالنک

>Je conçois que tu puisses avoir eu une journée fatigante
Exact, il est 6h du matin sur mon fuseau horaire et je ne suis pas couché (à prendre au sens premier du terme)

là dessus mes plus plates excuses, en effet je pense que mon inconscient (surement la dominante noire de ton avatar qui par mes origines occidental me fait associer sacredceltic => noir , noir => mal , sacredceltic => mal) m'a joué un tour.

en effet c'est la merde.

sysko sysko March 9, 2011 March 9, 2011 at 10:58:52 PM UTC link پرمالنک

ce n'était pas dans le fond. Je suis d'accord que le système est très loin d'être parfait, qu'il y a eu des erreurs de faites lors de conception, erreur que nous payons maintenant car rattraper le tir maintenant n'est plus aussi simple que si on l'avait corriger avant. Je n'ai contre non plus que tu fasses remarquer les dysfonctionnements et que même que tu t'en indignes, Trang et moi ne pensons pas être omniscient même sur notre propre travail, et certaines erreurs / défauts peuvent nous échapper, après pour l'indignation (peut-être pas l'adjectif le plus approprié, mais je ne trouve pas de mots plus proche pour le moment, ça va me revenir) , ok idem, on ne donne pas peut être la bonne priorité à chaque tâche, peut-être certaines devraient être traiter avant d'autre etc.

Tout cela d'accord,

Mais dès lors "c'est de la merde", non là je ne vois pas, ce n'est ni constructif, ni poli, ni respectueux. Peut-être lors de nos premiers échanges je n'ai pas non plus fait part de la plus grande courtoisie, mais ça ne semble pas une justification à continuer dans la lancé.