menu
Tatoeba
language
Zarejestruj się Zaloguj się
language Polski
menu
Tatoeba

chevron_right Zarejestruj się

chevron_right Zaloguj się

Przeglądaj

chevron_right Wyświetl losowe zdanie

chevron_right Przeglądaj po języku

chevron_right Przeglądaj według listy

chevron_right Przeglądaj po tagu

chevron_right Przeszukuj audio

Społeczność

chevron_right Tablica ogłoszeń

chevron_right Spis członków

chevron_right Członkowie wg języka

chevron_right Rodzimi użytkownicy języka

search
clear
swap_horiz
search
JimBreen JimBreen 21 marca 2010 21 marca 2010 06:11:23 UTC flag Report link Bezpośredni link

Traditional and Simplified Chinese

I saw the comment about converting hanzi on-the-fly. Be very cautious about that, as there are many cases where it simply doesn't work. Proper Traditional<->Simplified conversion needs to work at the lexeme level and in some cases needs some context for disambiguation.

Jack Halpern wrote a very good paper about this about 10 years ago:
http://www.cjk.org/cjk/c2c/c2cbasis.htm

PS: how do I make a comment on another posting?

{{vm.hiddenReplies[377] ? 'expand_more' : 'expand_less'}} ukryj odpowiedzi pokaż odpowiedzi
JimBreen JimBreen 21 marca 2010 21 marca 2010 06:40:28 UTC flag Report link Bezpośredni link

OK, I worked out how to do a follow-on. I'd clicked "reply" but it hadn't worked. Now it does.

sysko sysko 21 marca 2010 21 marca 2010 11:10:11 UTC flag Report link Bezpośredni link

the traditional to simplified chinese is not made at "character by character" level, but try to decompose the sentence (you can see how the sentence has been segmented by looking to pinyin)
As I've said I'm in conctact with the guy who develop it, so don't hesitate to report any bad segmentations, I will report to him