Poznámka
Data, která zde najdete, vám NEbudou užitečná, pokud nepíšete nástroj na práci s&jazyky nebo zpracování dat.
Pokud chcete jednoduše věty použitelné při výuce jazyka, vyzkoušejte seznamy vět. Můžete si sestavovat své vlastní nebo prohlížet ty vytvořené jinými uživateli. Seznamy lze stahovat i tisknout.
Obecné informace o souborech
Mnoho japonských a anglických vět pochází z korpusu Tanaka, který je volným dílem.
Creative commons
Soubory jsou k dispozici pod licencí CC BY 2.0 FR.

Část našich vět je též k dispozici pod licencí CC0 1.0.

Licence audionahrávek
Licenci audionahrávky volí přispěvatel a zobrazuje se na stránce, kde jsou uvedeny audio soubory tohoto přispěvatele.
Dotazy?
V případě dotazů nám neváhejte napsat. Většinou odpovíme velmi rychle.
Ke stažení
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Věty
- Název souboru
-
Všechny jazyky Pouze věty v: abazština abcházština adygejština afrihili afrikánština ainština ajmarština Aklanon albánština albánština (Gheg) altajština (jižní) alžírská arabština amharština Ancient Hebrew angličtina arabština arabština (marocká) aragonština ásámština Assyrian Neo-Aramaic asturština avadhština avarština ázerbajdžánština balijština balúčština bambarština bandžarština barmština baskičtina baškirština bavorština Baybayanon běloruština benátština bengálština berberština Berom bhojpurština bislamština bodoština bosenština bretonština Brithenig bulharština burjatština cebuánština Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Coastal Kadazan Cuyonon CycL čagatajština čečenština čerokíjština čeština činjandža čínština čínština (dialekty Gan) čínština (dialekty Hakka) čínština (dialekty Xiang) čínština (jižní min) čínština (klasická) činuk pidžin čoktština čukčtina čuvaština dánština Divehi dolnolužická srbština Dolnoněmčina (dolní němčina) Drents Dungan Dutton World Speedwords Eastern Armenian egyptská arabština emilijština Erromintxela erzjanština esperanto estonština evenkština eveština extremadurština faerština falčtina féničtina fidžijština finština francouzština francouzština (stará) fríština fríština (saterlandská) furlanština gagauzština galicijština gandština garhválština gaština gótština Gronings grónština gruzínština Guadeloupean Creole French guaraní gudžarátština Guerrero Nahuatl Gulf Arabic Gun haidština haidština (jižní) haitská kreolština hauština havajština hebrejština hiligajnonština hindština hindština (Fidži) Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho hornolužická srbština Hunsrik chakaština chamorro chavacano Chinese Pidgin English chorvatština ibanština ido igboština Ilokánština indonéština ingrijština Interglossa interlingua interlingue Interslavic inuktitutština irácká arabština irština Isan islandština italština jakutština Jamajský patois japonština javánština Jewish Babylonian Aramaic Jewish Palestinian Aramaic jidiš jorubština juhurština (židovská tatština) K'iche' kabardinština kabylština kadazandusunština kajugština kalmyčtina kambština kannadština kantonština Kapampangan karačajevo-balkarština karakalpačtina Karakhanid karelština kašmírština kašubština katalánština kazaština kečuánština Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khalaj khasi khmerština kiribatština kirundi klingonština kolínština komi-permjačtina Komi-Zyrian Konkani (Goan) korejština kornština korsičtina kotava kreolština (Louisiana) kríjština (z plání) krymská tatarština kumyčtina kurdština (jižní) Kven Finnish kyrgyzština Láadan ladino ladinština lakotština laoština latgalština latina lazština levantská arabština Lezgi Libyan Arabic ligurština limburština lingalština lingua franca nova litevština livonština lojban lombardština lotyština lucemburština Lushootseed maďarština madurština Mahasu Pahari maithiliština makedonština malajálamština malajština Malay (Vernacular) malgaština maltština mambaiština Mandar mandžuština manipurština manština maorština mapudungun maráthština marijština (horská) marijština (lužní) maršálština mauricijská kreolština micmac Middle Persian (Pahlavi) minangkabau mingrelština mirandština mohawkština mokšanština mongolština Mono (USA) monština Muskogee (Creek) Naga (Tangshang) náhuatl Nande nauruština navažština neapolština němčina němčina (Švýcarsko) nepálština névárština Ngeq Nigerian Fulfulde niueština nizozemština nogajština norština (bokmål) norština (nynorsk) norština historická North Frisian North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) novial nuerština Nuosu Nyungar O'odham Odia (Oriya) odžibvejština okcitánština Okinawština Old Aramaic Old Frisian Old Saxon Old Turkish Orizaba Nahuatl osetština osmanština palauština pálí pandžábština (východní) paňdžábština (západní) pangasinanština papiamento paštština pensylvánská němčina perština piemonština pikardština pipilština polština portugalština pruština Pulaar Qashqai quenijština Rapanuiština Rendille rétorománština rohingština romština rumunština rusínština ruština rwandština řečtina samojština sámština (jižní) sámština (severní) sangština sanskrt santálština sardština Setswana Seychelská kreolština shuswap sicilština Silotčtina sindarština sindhština sinhálština siriačtina siswatština skotská gaelština skotština slezština slovenština slovinština somálština sotština (jižní) South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tongo srbština stará španělština staroangličtina staroruština starořečtina střední angličtina střední francouzština sumerština sundština svahilština svahilština (Kongo) Swabian syrština šanghajština šona španělština švédština tádžičtina Tagal Murut tagalog Tahaggart Tamahaq tahitština Tachawit talossština talyština tamazight (standardní marocký) tamilština Tarifit tašelhit tatarština telugština Temuan tetum thajština tibetština tigrejština tigrinijština Ťin Tok Pisin Tokelauština toki pona Tonga (Zambezi) tongánština tsonga tumbukština Tupinambá turečtina turkménština tuvalština tuvinština Uab Meto udmurtština ujgurština ukrajinština umbundu urdština Urhobo uzbečtina valonština velština vepština vietnamština volapük võruština warajština wayúuština West-Central Oromo wolofština xhoština Yucatec Maya Západní Arménština zazaki zélandština zuluština žemaitština Neznámý jazyk - Popis souboru
- Obsahuje veškeré věty ve zvoleném jazyce. Každá věta má své jedinečné identifikační číslo a je opatřena jazykovým kódem podle ISO 639-3.
- Pole a struktura
- Číslo věty [tab] Jazyk [tab] Text
Podrobnosti o větách
- Název souboru
-
{{sentencesDetailed | filename}}
Všechny jazyky Pouze věty v: abazština abcházština adygejština afrihili afrikánština ainština ajmarština Aklanon albánština albánština (Gheg) altajština (jižní) alžírská arabština amharština Ancient Hebrew angličtina arabština arabština (marocká) aragonština ásámština Assyrian Neo-Aramaic asturština avadhština avarština ázerbajdžánština balijština balúčština bambarština bandžarština barmština baskičtina baškirština bavorština Baybayanon běloruština benátština bengálština berberština Berom bhojpurština bislamština bodoština bosenština bretonština Brithenig bulharština burjatština cebuánština Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Coastal Kadazan Cuyonon CycL čagatajština čečenština čerokíjština čeština činjandža čínština čínština (dialekty Gan) čínština (dialekty Hakka) čínština (dialekty Xiang) čínština (jižní min) čínština (klasická) činuk pidžin čoktština čukčtina čuvaština dánština Divehi dolnolužická srbština Dolnoněmčina (dolní němčina) Drents Dungan Dutton World Speedwords Eastern Armenian egyptská arabština emilijština Erromintxela erzjanština esperanto estonština evenkština eveština extremadurština faerština falčtina féničtina fidžijština finština francouzština francouzština (stará) fríština fríština (saterlandská) furlanština gagauzština galicijština gandština garhválština gaština gótština Gronings grónština gruzínština Guadeloupean Creole French guaraní gudžarátština Guerrero Nahuatl Gulf Arabic Gun haidština haidština (jižní) haitská kreolština hauština havajština hebrejština hiligajnonština hindština hindština (Fidži) Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho hornolužická srbština Hunsrik chakaština chamorro chavacano Chinese Pidgin English chorvatština ibanština ido igboština Ilokánština indonéština ingrijština Interglossa interlingua interlingue Interslavic inuktitutština irácká arabština irština Isan islandština italština jakutština Jamajský patois japonština javánština Jewish Babylonian Aramaic Jewish Palestinian Aramaic jidiš jorubština juhurština (židovská tatština) K'iche' kabardinština kabylština kadazandusunština kajugština kalmyčtina kambština kannadština kantonština Kapampangan karačajevo-balkarština karakalpačtina Karakhanid karelština kašmírština kašubština katalánština kazaština kečuánština Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khalaj khasi khmerština kiribatština kirundi klingonština kolínština komi-permjačtina Komi-Zyrian Konkani (Goan) korejština kornština korsičtina kotava kreolština (Louisiana) kríjština (z plání) krymská tatarština kumyčtina kurdština (jižní) Kven Finnish kyrgyzština Láadan ladino ladinština lakotština laoština latgalština latina lazština levantská arabština Lezgi Libyan Arabic ligurština limburština lingalština lingua franca nova litevština livonština lojban lombardština lotyština lucemburština Lushootseed maďarština madurština Mahasu Pahari maithiliština makedonština malajálamština malajština Malay (Vernacular) malgaština maltština mambaiština Mandar mandžuština manipurština manština maorština mapudungun maráthština marijština (horská) marijština (lužní) maršálština mauricijská kreolština micmac Middle Persian (Pahlavi) minangkabau mingrelština mirandština mohawkština mokšanština mongolština Mono (USA) monština Muskogee (Creek) Naga (Tangshang) náhuatl Nande nauruština navažština neapolština němčina němčina (Švýcarsko) nepálština névárština Ngeq Nigerian Fulfulde niueština nizozemština nogajština norština (bokmål) norština (nynorsk) norština historická North Frisian North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) novial nuerština Nuosu Nyungar O'odham Odia (Oriya) odžibvejština okcitánština Okinawština Old Aramaic Old Frisian Old Saxon Old Turkish Orizaba Nahuatl osetština osmanština palauština pálí pandžábština (východní) paňdžábština (západní) pangasinanština papiamento paštština pensylvánská němčina perština piemonština pikardština pipilština polština portugalština pruština Pulaar Qashqai quenijština Rapanuiština Rendille rétorománština rohingština romština rumunština rusínština ruština rwandština řečtina samojština sámština (jižní) sámština (severní) sangština sanskrt santálština sardština Setswana Seychelská kreolština shuswap sicilština Silotčtina sindarština sindhština sinhálština siriačtina siswatština skotská gaelština skotština slezština slovenština slovinština somálština sotština (jižní) South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tongo srbština stará španělština staroangličtina staroruština starořečtina střední angličtina střední francouzština sumerština sundština svahilština svahilština (Kongo) Swabian syrština šanghajština šona španělština švédština tádžičtina Tagal Murut tagalog Tahaggart Tamahaq tahitština Tachawit talossština talyština tamazight (standardní marocký) tamilština Tarifit tašelhit tatarština telugština Temuan tetum thajština tibetština tigrejština tigrinijština Ťin Tok Pisin Tokelauština toki pona Tonga (Zambezi) tongánština tsonga tumbukština Tupinambá turečtina turkménština tuvalština tuvinština Uab Meto udmurtština ujgurština ukrajinština umbundu urdština Urhobo uzbečtina valonština velština vepština vietnamština volapük võruština warajština wayúuština West-Central Oromo wolofština xhoština Yucatec Maya Západní Arménština zazaki zélandština zuluština žemaitština Neznámý jazyk - Popis souboru
- Obsahuje další pole s informacemi o každé větě (vlastník, datum vytvoření/úpravy).
- Pole a struktura
- Číslo věty [tab] Jazyk [tab] Text [tab] Přezdívka [tab] Datum přidání [tab] Datum poslední úpravy
Original and Translated Sentences
- Název souboru
- sentences_base.tar.bz2
- Popis souboru
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Pole a struktura
- Číslo věty [tab] Base field
Věty (CC0)
- Název souboru
-
Všechny jazyky Pouze věty v: alžírská arabština Ancient Hebrew angličtina arabština běloruština bengálština berberština čeština čínština čínština (klasická) dánština esperanto féničtina finština francouzština hebrejština hindština Ho ido interlingua interlingue italština japonština Jewish Babylonian Aramaic Jewish Palestinian Aramaic jidiš kabylština kantonština karelština katalánština klingonština Konkani (Goan) Kven Finnish Láadan ladino latina ligurština maďarština němčina nizozemština norština (bokmål) norština historická Nyungar Odia (Oriya) Old Aramaic Old Frisian polština portugalština ruština santálština Silotčtina starořečtina střední angličtina španělština švédština Tachawit tamazight (standardní marocký) toki pona ukrajinština velština volapük Neznámý jazyk - Popis souboru
- Obsahuje všechny věty, které jsou k dispozici pod licencí CC0.
- Pole a struktura
- Číslo věty [tab] Jazyk [tab] Text [tab] Datum poslední úpravy
Spoje
- Název souboru
- links.tar.bz2
- Popis souboru
- Pokrývá spoje mezi větami. 1 [tab] 77 znamená, že věta č. 77 je překladem věty č. 1. Zahrnuty jsou i vzájemné spoje, takže soubor bude obsahovat i řádky říkající 77 [tab] 1.
- Pole a struktura
- Číslo věty [tab] Číslo překladu
Štítky
- Název souboru
- tags.tar.bz2
- Popis souboru
- Obsahue seznam štítků náležících jednotlivým větám. 381279 [tab] proverb znamená, že k větě č. 381279 byl přidán štítek „proverb“.
- Pole a struktura
- Číslo věty [tab] Název štítku
Seznamy
- Název souboru
- user_lists.tar.bz2
- Popis souboru
- Obsahuje výpis seznamů vět.
- Pole a struktura
- Číslo seznamu [tab] Přezdívka [tab] Datum vytvoření [tab] Datum poslední úpravy [tab] Název seznamu [tab] Editable by
Věty v seznamech
- Název souboru
- sentences_in_lists.tar.bz2
- Popis souboru
- Označuje věty, které jsou zahrnuty v seznamech. 13 [tab] 381279 znamená, že věta č. 381279 je zahrnuta v seznamu s identifikačním číslem 13.
- Pole a struktura
- Číslo seznamu [tab] Číslo věty
Indexy pro japonštinu
- Název souboru
- jpn_indices.tar.bz2
- Popis souboru
- Obsahuje ekvivalent takzvaných „B lines“ v korpusu Tanaka, distribuovaném Jimem Breenem. Pro informace o formátu vizte tuto stránku. Každý údaj náleží k nějakému páru japonské a anglické věty. Číslo věty značí identifikační číslo japonské věty, Číslo významu pak číslo anglického protějšku.
- Pole a struktura
- Číslo věty [tab] Číslo významu [tab] Text
Věty s audionahrávkami
- Název souboru
- sentences_with_audio.tar.bz2
- Popis souboru
- Obsahuje identifikační čísla všech vět ve všech jazycích, u kterých existuje audionahrávka. Ostatní pole obsahují informace o tom, kdo nahrávku pořídil, jaké je její licence, a odkaz sloužící k uvedení jejího autora. Pokud je pole pro licenci prázdné, audionahrávku není dovoleno používat mimo rámec projektu Tatoeba.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Pole a struktura
- Číslo věty [tab] Audio id [tab] Přezdívka [tab] Licence [tab] Attribution URL
Uživatelské úrovně znalostí dle jazyka
- Název souboru
- user_languages.tar.bz2
- Popis souboru
- Naznačuje u uživatelů jejich úrovně znalostí v jednotlivých jazycích. (Úrovně znalostí si uživatelé přiřazují sami.)
- Pole a struktura
- Jazyk [tab] Úroveň znalosti [tab] Přezdívka [tab] Podrobnosti
Hodnocení vět uživateli
- Název souboru
- users_sentences.csv
- Popis souboru
- Obsahuje věty ohodnocené uživateli. Provedená kontrola může mít hodnotu -1 (věta není v pořádku), 0 (uživatel se nerozhodl nebo si není jistý), nebo 1 (věta je v pořádku). Pozor: tato vlastnost je stále ve fázi testování.
- Pole a struktura
- Přezdívka [tab] Číslo věty [tab] Hodnocení [tab] Datum přidání [tab] Datum poslední úpravy
Přepisy
- Název souboru
-
Všechny jazyky Pouze věty v: čínština japonština kantonština uzbečtina - Popis souboru
- Obsahuje veškeré přepisy v pomocných nebo alternativních druzích písma. Uživatelské jméno spojené s přepisem označuje uživatele, který přepis naposledy hodnotil a případně ho upravoval. Přepis bez uživatelského jména zatím nebyl označen jako zkontrolovaný. Název použitého písma je uvedený podle normy ISO 15924.
- Pole a struktura
- Číslo věty [tab] Jazyk [tab] Script name [tab] Přezdívka [tab] Přepis