menu
Tatoeba
language
Luo käyttäjätili Kirjaudu sisään
language Suomi
menu
Tatoeba

chevron_right Luo käyttäjätili

chevron_right Kirjaudu sisään

Selaa

chevron_right Näytä satunnainen lause

chevron_right Selaa kielen mukaan

chevron_right Selaa listan mukaan

chevron_right Selaa tunnisteen mukaan

chevron_right Selaa äänitteitä

Yhteisö

chevron_right Seinä

chevron_right Luettelo kaikista jäsenistä

chevron_right Jäsenten kielet

chevron_right Äidinkieliset puhujat

search
clear
swap_horiz
search

Seinä (7 147 viestiketjua)

Vinkit

Ennen kun esität kysymyksen, varmista, että olet lukenut UKK:n.

Pyrimme ylläpitämään tervettä ilmapiiriä sivistyneelle keskustelulle. Luethan meidän sääntömme huonoa käytöstä vastaan.

Uusimmat viestit feedback

sharptoothed

12 tuntia sitten

subdirectory_arrow_right

frpzzd

10 päivää sitten

subdirectory_arrow_right

EugeneGS

10 päivää sitten

subdirectory_arrow_right

frpzzd

10 päivää sitten

subdirectory_arrow_right

EugeneGS

11 päivää sitten

subdirectory_arrow_right

frpzzd

11 päivää sitten

subdirectory_arrow_right

gillux

11 päivää sitten

feedback

frpzzd

13 päivää sitten

feedback

sharptoothed

14 päivää sitten

subdirectory_arrow_right

marafon

15 päivää sitten

jakov jakov 5. tammikuuta 2011 5. tammikuuta 2011 klo 0.45.11 UTC flag Tee ilmoitus link Ikilinkki

Can Text from a project under the GNU GPL Version 2 be added without concern? I've read that Tatoeba is licenced under CC but i am not sure what consequences this has: Does it mean i have to add a comment to every sentence i copy from a gpl project?
What I would like to do is add some sentences from www.reta-vortaro.de

{{vm.hiddenReplies[4640] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Zifre Zifre 5. tammikuuta 2011 5. tammikuuta 2011 klo 2.21.03 UTC flag Tee ilmoitus link Ikilinkki

Unfortunately, I don't think this is possible. According to http://www.gnu.org/licenses/lic...OtherLicenses, the GPL is not compatible with CC-BY.

sysko sysko 5. tammikuuta 2011 5. tammikuuta 2011 klo 5.31.19 UTC flag Tee ilmoitus link Ikilinkki

you still can contact the author to ask him if he's the author of this sentences, or if at least it does have the right on these sentences, so that he can give you a copy of them relicenced under the CC-BY or a compatible licence. Because to be honest the GPL has not been made for text, books or so, there are more suitable licences for this kind of data (such as the CC-BY / CC-BY-SA , or the Gnu FDL if you want to say in Gnu's licence), so I do think the guy chose th GPL more because it was to say "my data are open" rather than for the exact terms of the licence. So it costs nothing to ask :) (1000 shanghainese sentences come from a copyrighted books for which the author given me the explicit authorization to use them under CC-BY)

frankou frankou 5. tammikuuta 2011 5. tammikuuta 2011 klo 5.10.37 UTC flag Tee ilmoitus link Ikilinkki

But there still have lots of local word like country name, person name, and nouns.

{{vm.hiddenReplies[4646] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
sysko sysko 5. tammikuuta 2011 5. tammikuuta 2011 klo 5.15.26 UTC flag Tee ilmoitus link Ikilinkki

but it's still not a different language, and it still can be written in both script. If a sentence is specific to a part of China, then it will be tagged accordingly.

frankou frankou 5. tammikuuta 2011 5. tammikuuta 2011 klo 4.22.20 UTC flag Tee ilmoitus link Ikilinkki

Hi, I'm a traditional Chinese user.
There two types in Chinese:
Simple Chinese, use in China, and some south-east Asia country.
Traditional Chinese, use in Taiwan, Hong Kong, Macao.

Could you please add Simple Chinese and Traditional Chinese, not only "Chinese"?

Thank you!

{{vm.hiddenReplies[4644] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
sysko sysko 5. tammikuuta 2011 5. tammikuuta 2011 klo 5.01.45 UTC flag Tee ilmoitus link Ikilinkki

Hi, glad to see a new Chinese user here
If you take a look you will see that each chinese sentences come with both script, and when you add a sentence, the other script version is automatically generated. Moreover as said, it's 2 different scripts, not 2 different languages.

{{vm.hiddenReplies[4645] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Zifre Zifre 5. tammikuuta 2011 5. tammikuuta 2011 klo 20.52.49 UTC flag Tee ilmoitus link Ikilinkki

How accurate is the simplified to traditional conversion? As I understand it, every traditional character corresponds to one unique simplified character, but the reverse is not true, as many characters were combined. Does the software make smart guesses based on context? Or does it just always choose the most common one?

I prefer traditional characters and I would like to make sure that any auto-generated conversions are correct so I don't use the wrong characters. ;-)

{{vm.hiddenReplies[4654] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
sysko sysko 5. tammikuuta 2011 5. tammikuuta 2011 klo 21.43.02 UTC flag Tee ilmoitus link Ikilinkki

the software works on "words" y "words" not on characters by characters, and looking to the number of "words" I use (around 100k). I think it's really realiable, as anyway it's the technics used by wikipedia (and their words list is far shorter than mine), and most of possible ambiguity disappear if you see the text as "words" (anyway otherwise it would have been ambigous for human reader too).
But after some "errors" are still possible, for the rare case of single characters "words" and also for errors in the words list itself. So by correcting the words list, and by permit manual edit of the generated "other script" version (which will be possible in a near future) we should be able to reach easily a 99,9% accuracy. (I think we're near 95~98% for the moment)

minshirui minshirui 8. tammikuuta 2011 8. tammikuuta 2011 klo 4.03.41 UTC flag Tee ilmoitus link Ikilinkki

Just FYI, every traditional character does not correspond to one unique simplified character. Cases in point:
著 (zhe) -> 着
著 (zhù) -> 著

minshirui minshirui 5. tammikuuta 2011 5. tammikuuta 2011 klo 17.49.23 UTC flag Tee ilmoitus link Ikilinkki

Is there any sort of tagging added to the two sentences to say that one is simplified and the other traditional? I see this as being very useful if people want to use tatoeba as part of other applications.

{{vm.hiddenReplies[4652] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
sysko sysko 5. tammikuuta 2011 5. tammikuuta 2011 klo 18.05.03 UTC flag Tee ilmoitus link Ikilinkki

chinese sentences has a little icon in the icon bar to say if it's simplified or traditional script.

{{vm.hiddenReplies[4653] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Pharamp Pharamp 6. tammikuuta 2011 6. tammikuuta 2011 klo 9.49.23 UTC flag Tee ilmoitus link Ikilinkki

I don't see the little icon any more too, sysko!

{{vm.hiddenReplies[4659] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
sysko sysko 10. tammikuuta 2011 10. tammikuuta 2011 klo 10.00.24 UTC flag Tee ilmoitus link Ikilinkki

i've just fixed it :)

minshirui minshirui 5. tammikuuta 2011 5. tammikuuta 2011 klo 23.13.48 UTC flag Tee ilmoitus link Ikilinkki

Hmm... I don't see that on this sentence: http://tatoeba.org/eng/sentences/show/692904

{{vm.hiddenReplies[4656] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Zifre Zifre 6. tammikuuta 2011 6. tammikuuta 2011 klo 1.06.19 UTC flag Tee ilmoitus link Ikilinkki

It looks fine to me. The sentence appears to be traditional Chinese. Below that is the pinyin. And below that is the simplified Chinese (in light grey).

jakov jakov 4. tammikuuta 2011 4. tammikuuta 2011 klo 23.58.21 UTC flag Tee ilmoitus link Ikilinkki

If one translates a sentence that has a tag, the tag gets "lost" i.e. One doesnt see it next to the translated sentence. I think the tags of a sentence should be displayed just like the sentences themselves: the tags of the sentence youre looking at in colour and the ones of the translations greyed out (or similar). Like this these tags could get shortcuts to add the same tag to the current sentence and (even more important) work as a kind of annotation.
E.g. if the tag next to a translation says "rude" I would rather not use it in a letter.
Would this be a good idea for the upcoming version? What do you think?

{{vm.hiddenReplies[4636] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Zifre Zifre 5. tammikuuta 2011 5. tammikuuta 2011 klo 0.14.44 UTC flag Tee ilmoitus link Ikilinkki

I think this makes sense for some tags, but not for others. For example "です。", "6 syllables", and "Spain Spanish" shouldn't be showing up on translations.

On the other hand, something like "weather", "family", or "romance" probably could apply to translations.

Theoretically, the system could keep a list of tags that were okay to apply to translations automatically, but I don't think it's really a necessary feature.

What I would like to see a lot more is a system for adding metadata. It would be like tags, except that the tag would store data. For example rather than having "by Albert Einstein" and "by Mark Twain", we would have a data-tag "by" and sentences could have "by: Albert Einstein" and "by: Mark Twain". A better example might be replacing "8 to 10 words" etc. with "number of words: 9" etc. Then the search function could let you, for example, find all the English sentences with between 12 and 19 words. The system could also be automated so we didn't have to sit there counting words. :-)

{{vm.hiddenReplies[4637] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
jakov jakov 5. tammikuuta 2011 5. tammikuuta 2011 klo 0.58.48 UTC flag Tee ilmoitus link Ikilinkki

Sorry, i didnt point this out clear enough: I wouldnt want to automatically copy the tags, but just have the option to quickly do so. This means that there could be "spain spanish" next to the spanish translation of the current sentence (which wouldnt make much sence to click on unless the current sentence is also spanish). But if there would be written "family" next to the spanish sentnce and the current sentence also refers to something about "family" you might decide to click it and thereby quickly add this tag to the current sentence too.
As far as I see, not much "filter" needed

This would also add an oportunity to allow adding these tags for not-yet "trusted users": They would just click the tag from the oher sentence, without the possibility to mess things up.
Also I like your metadata-idea - lets see how sysko is going to solve this.

{{vm.hiddenReplies[4641] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
jakov jakov 5. tammikuuta 2011 5. tammikuuta 2011 klo 1.00.44 UTC flag Tee ilmoitus link Ikilinkki

As for necessity: i think this might promote the usage of tags.

Alois Alois 4. tammikuuta 2011 4. tammikuuta 2011 klo 22.58.43 UTC flag Tee ilmoitus link Ikilinkki

La frazoj numero 698866 kaj 398316 estas samsignifaj. Kiu povas kunigi ilin?

{{vm.hiddenReplies[4633] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
jakov jakov 4. tammikuuta 2011 4. tammikuuta 2011 klo 23.09.06 UTC flag Tee ilmoitus link Ikilinkki

Vi nu devas aldoni komenton, ke iu admin bonvole kunligu la du frazojn.
Aux vi demadu na Trang cxu sxi vin igus "trusted user". Tiam vi povus ligi iun frazon al viaj frazoj.

papabear papabear 4. tammikuuta 2011 4. tammikuuta 2011 klo 20.36.20 UTC flag Tee ilmoitus link Ikilinkki

Are there any guidelines for sentence length?

{{vm.hiddenReplies[4626] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Pharamp Pharamp 4. tammikuuta 2011 4. tammikuuta 2011 klo 20.48.49 UTC flag Tee ilmoitus link Ikilinkki

No, there aren't strict guidelines, but the input form has limited characters (but I don't know the exact length allowed).

Anyway, remember that sentences should be useful for learners, so maybe you could for example split a paragraph in two sentences and put a link to the other one below, in a comment.

For long texts, like public domain books, we will have a separate section in the future, so it is better to add at least short quotes or small paragraphs you like best, and the entire novel / speech / essay will be translated when this feature will be available.

sysko sysko 4. tammikuuta 2011 4. tammikuuta 2011 klo 21.20.35 UTC flag Tee ilmoitus link Ikilinkki

the technical limitation is 500 characters (due to the way we store sentences). After for the "guideline" part, I agree with what Pahramp said.

menix menix 4. tammikuuta 2011 4. tammikuuta 2011 klo 20.09.41 UTC flag Tee ilmoitus link Ikilinkki

I just bring up Ukrainian translations to 15000. Слава Україні! :)

{{vm.hiddenReplies[4625] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Demetrius Demetrius 4. tammikuuta 2011 4. tammikuuta 2011 klo 20.41.26 UTC flag Tee ilmoitus link Ikilinkki

Are we expected to answer „Героям слава“? :)

{{vm.hiddenReplies[4628] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
menix menix 4. tammikuuta 2011 4. tammikuuta 2011 klo 22.35.59 UTC flag Tee ilmoitus link Ikilinkki

on your discretion :*)

Pharamp Pharamp 4. tammikuuta 2011 4. tammikuuta 2011 klo 20.40.17 UTC flag Tee ilmoitus link Ikilinkki

Great! Thank you very much!

xtofu80 xtofu80 4. tammikuuta 2011 4. tammikuuta 2011 klo 14.59.01 UTC flag Tee ilmoitus link Ikilinkki

Can I see the status of a user, whether he/she is able to link/unlink sentences? If I want to ask a user to link a sentence he/she owns, this only makes sense if the user has the corresponding user rights.

{{vm.hiddenReplies[4619] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Zifre Zifre 4. tammikuuta 2011 4. tammikuuta 2011 klo 19.55.09 UTC flag Tee ilmoitus link Ikilinkki

The users page shows moderators and trusted users first (and those are the ones who can link sentences). Right now, there are few enough that you can easily search through the list. (It only goes to the beginning of the third page.)

Eventually, if Tatoeba ever had enough trusted users that this became harder, then I think a feature to show a user's type on their profile would be more necessary.

debian2007 debian2007 4. tammikuuta 2011 4. tammikuuta 2011 klo 17.14.57 UTC flag Tee ilmoitus link Ikilinkki

(Delete wall post function is gone? I used a few times before. ... or I have a sort of amnesia.)

{{vm.hiddenReplies[4620] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Swift Swift 4. tammikuuta 2011 4. tammikuuta 2011 klo 17.30.03 UTC flag Tee ilmoitus link Ikilinkki

Nope, still here...
... but only if no-one has replied to that post.

{{vm.hiddenReplies[4622] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
debian2007 debian2007 4. tammikuuta 2011 4. tammikuuta 2011 klo 17.32.50 UTC flag Tee ilmoitus link Ikilinkki

Thank you. I did not saw the feature in the comment of revisions. Maybe I mistaken.

luna luna 3. tammikuuta 2011 3. tammikuuta 2011 klo 10.34.04 UTC flag Tee ilmoitus link Ikilinkki

Hi!
How can I suggest better Japanese sentences of explanation or instruction, such as the sentences of "TIPS" in the right column?

{{vm.hiddenReplies[4605] ? 'expand_more' : 'expand_less'}} piilota vastaukset näytä vastaukset
Demetrius Demetrius 4. tammikuuta 2011 4. tammikuuta 2011 klo 10.06.17 UTC flag Tee ilmoitus link Ikilinkki

Tatoeba uses the Launchpad site for translations. So you can register on Launchpad and change the translation there directly: https://translations.launchpad.net/tatoeba

Or you can simply post your corrections here, on the wall. ^^

(But note that it usually takes some time to update the interface text...)