Qeyd
The data you will find here will NOT be useful unless you are coding a language tool or processing data.
If you simply want sentences that you can use to learn a language, check out the sentence lists. You can build your own, or view the ones that others have created. The lists can be downloaded and printed.
Fayllar haqqında ümumi məlumat
Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.
Creative commons
These files are released under CC BY 2.0 FR.

A part of our sentences are also available under CC0 1.0.

Licenses covering audio
The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.
Suallar?
If you have questions or requests, feel free to contact us. In general, we answer quickly.
Yüklənənlər
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Cümlələr:
- Fayl adı
-
Bütün dillər Cümlələr ancaq bu dildə: Abazin dili Abxaz dili adıgey afrihili afrikaans Aklanon alban alman amhar Ancient Hebrew Ao Naga araqon Asoru dili assam asturiya aşağı sorb avadhi Avar dili aymara aynu azərbaycan bali baluc bambara Banjar bask başqırd Bavariya dialekti Baybayanon belarus Benqal dili Berber Berom bxoçpuri birman bislama bodo bokmal norveç bolqar bosniya breton Brithenig Buryat dili Central Bikol Central Dusun Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong cənubi altay cənubi haida cənubi kürd cənubi sami Chavacano Chinese Pidgin English Chinyanja Coastal Kadazan Cuyonon CycL çağatay çamoro çeçen çex çeroki çin çinuk ləhçəsi çoktau Çukot dili çuvaş danimarka darqva Drents Dunqan dili Dutton World Speedwords Eastern Armenian Extremaduran Emilian Erromintxela erzya esperanto eston eve Evenk dili ərəb Ərəb dilinin Əlcəzair dialekti Ərəb dilinin İran körfəzi dialekti Ərəb dilinin Misir dialekti farer fars fici Fici hind dili Fin dili foyenik fransız Frisian friul Garhwali Gheg Albanian Greenlandic Gronings Guadeloupean Creole French Guerrero Nahuatl Gun gürcü haiti kreol hakka hausa havay hayda hiliqaynon Hill Mari hind Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho holland Hunsrik Xakas dili xazi Xələc dili xorvat xosa Ilocano Interglossa Interslavic Iraqi Arabic Isan iban idiş İdo dili iqbo indoneziya ingilis İnqriya dili interlinqua interlinqve inuktitut irland island İspan dili isveç İsveçrə almancası İtalyan dili ivrit Jamaican Patois Jewish Babylonian Aramaic Jewish Palestinian Aramaic Jin Chinese Juhuri (Judeo-Tat) K'iche' kabarda-çərkəz kabile kalmık kamba kannada kanton Kapampangan karel kaşubyan katalan Kayuqa keçua Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut kəşmir kxmer kinyarvanda Kirundi klinqon komi-permyak Komi-zıryan dili Konkani (Goan) Konqo suahilicəsi koreya korn korsika Kotava Kölsch Krımtatar dili kumık Kven Finnish qa qaqauz qalisiya qan qaraçay-balkar Qaraçı dili Qaraxanlı türkçəsi Qaraqalpaq dili Qaşqay dili qazax qədim fransız qədim ingilis qədim nors qədim rus dili qədim yunan Qərbi erməni dili qırğız qilbert qotika quarani qucarat Quenya Láadan Ladin lakota laos Latgalian latın Latış dili Laz dili Lezgi Libyan Arabic Liquriya dili limburq Lingua Franca Nova linqala Literary Chinese litva Livon dili loğban Lombard dili Low German (Low Saxon) Luganda Luiziana kreolu Lushootseed lüksemburq macar maduriz Mahasu Pahari maitili makedon malaqas malay Malay (Vernacular) malayalam Maldiv dili malta Mambae mançu Mandar manks maori mapuçe marathi marşal Meadow Mari Meitei Meqrel dili Middle Persian (Pahlavi) mikmak Min Nan minanqkaban mirand mohavk mokşa Mon monqol Mono (USA) morisien Moroccan Arabic Muskogee (Creek) müasir venet dili Naga (Tangshang) Nahuatl Nande Nauru dili navayo neapolitan nepal nevari Ngeq Nigerian Fulfulde niyuan noqay North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial dili nuer Nuosu nünorsk norveç Nyungar O'odham Odia (Oriya) Ojibwe Okinawan oksitan Old Aramaic Old Frisian Old Prussian Old Saxon Old Spanish Old Turkish Orizaba Nahuatl orta fransız orta ingilis Osetin dili osman ova kricəsi özbək Palatine German palayan pali panqasinan papyamento Pennsylvania German Pikard dili Pipil Polyakca Portuqalca Pulaar Punjabi (Eastern) Punjabi (Western) puştu Pyemont dili Rapa Nui Rendille Rohinca romanş rumın Rus dili Rusin dili saxa samoa Samogitian sanqo sanskrit santal Saraiki sardin Saterland Frisian sebuan sefard serb sesoto Setswana Seyşel Kreol dili Shanghainese Shuswap siciliya Silesian Sindarin sindhi sinhala skots slovak sloven somali sonqa South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tonqo suahili sumeryan sundan Suriya dili Svan Svati dili syan Sylheti Swabian Şimali friz dili şimali sami şona Şotlandiya keltcəsi Tachawit tacik Tagal Murut Tahaggart Tamahaq taxiti taqaloq Talış dili Talossan tamazi tamil Tarifit Tashelhit tatar tay teluqu Temuan Tetun tibet tiqre tiqrin tok pisin Tokelauan tokipona Tonga (Zambezi) tonqa tumbuka Tupinambá Tuvaluan tuvinyan türk türkmən Uab Meto udmurt uels ukrayna umbundu urdu Urhobo uyğur valun varay Veps dili volapük volof Võro vyetnam Yaponca yava yoruba Yucatec Maya yuxarı sorb yunan zaza Zeelandic zulu Wayuu West-Central Oromo Unknown language - Fayl açıqlaması
- Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
- Sahələr və struktur
- Cümlə id-si [tab] Lang [tab] Mətn
Detailed Sentences
- Fayl adı
-
{{sentencesDetailed | filename}}
Bütün dillər Cümlələr ancaq bu dildə: Abazin dili Abxaz dili adıgey afrihili afrikaans Aklanon alban alman amhar Ancient Hebrew Ao Naga araqon Asoru dili assam asturiya aşağı sorb avadhi Avar dili aymara aynu azərbaycan bali baluc bambara Banjar bask başqırd Bavariya dialekti Baybayanon belarus Benqal dili Berber Berom bxoçpuri birman bislama bodo bokmal norveç bolqar bosniya breton Brithenig Buryat dili Central Bikol Central Dusun Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong cənubi altay cənubi haida cənubi kürd cənubi sami Chavacano Chinese Pidgin English Chinyanja Coastal Kadazan Cuyonon CycL çağatay çamoro çeçen çex çeroki çin çinuk ləhçəsi çoktau Çukot dili çuvaş danimarka darqva Drents Dunqan dili Dutton World Speedwords Eastern Armenian Extremaduran Emilian Erromintxela erzya esperanto eston eve Evenk dili ərəb Ərəb dilinin Əlcəzair dialekti Ərəb dilinin İran körfəzi dialekti Ərəb dilinin Misir dialekti farer fars fici Fici hind dili Fin dili foyenik fransız Frisian friul Garhwali Gheg Albanian Greenlandic Gronings Guadeloupean Creole French Guerrero Nahuatl Gun gürcü haiti kreol hakka hausa havay hayda hiliqaynon Hill Mari hind Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho holland Hunsrik Xakas dili xazi Xələc dili xorvat xosa Ilocano Interglossa Interslavic Iraqi Arabic Isan iban idiş İdo dili iqbo indoneziya ingilis İnqriya dili interlinqua interlinqve inuktitut irland island İspan dili isveç İsveçrə almancası İtalyan dili ivrit Jamaican Patois Jewish Babylonian Aramaic Jewish Palestinian Aramaic Jin Chinese Juhuri (Judeo-Tat) K'iche' kabarda-çərkəz kabile kalmık kamba kannada kanton Kapampangan karel kaşubyan katalan Kayuqa keçua Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut kəşmir kxmer kinyarvanda Kirundi klinqon komi-permyak Komi-zıryan dili Konkani (Goan) Konqo suahilicəsi koreya korn korsika Kotava Kölsch Krımtatar dili kumık Kven Finnish qa qaqauz qalisiya qan qaraçay-balkar Qaraçı dili Qaraxanlı türkçəsi Qaraqalpaq dili Qaşqay dili qazax qədim fransız qədim ingilis qədim nors qədim rus dili qədim yunan Qərbi erməni dili qırğız qilbert qotika quarani qucarat Quenya Láadan Ladin lakota laos Latgalian latın Latış dili Laz dili Lezgi Libyan Arabic Liquriya dili limburq Lingua Franca Nova linqala Literary Chinese litva Livon dili loğban Lombard dili Low German (Low Saxon) Luganda Luiziana kreolu Lushootseed lüksemburq macar maduriz Mahasu Pahari maitili makedon malaqas malay Malay (Vernacular) malayalam Maldiv dili malta Mambae mançu Mandar manks maori mapuçe marathi marşal Meadow Mari Meitei Meqrel dili Middle Persian (Pahlavi) mikmak Min Nan minanqkaban mirand mohavk mokşa Mon monqol Mono (USA) morisien Moroccan Arabic Muskogee (Creek) müasir venet dili Naga (Tangshang) Nahuatl Nande Nauru dili navayo neapolitan nepal nevari Ngeq Nigerian Fulfulde niyuan noqay North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial dili nuer Nuosu nünorsk norveç Nyungar O'odham Odia (Oriya) Ojibwe Okinawan oksitan Old Aramaic Old Frisian Old Prussian Old Saxon Old Spanish Old Turkish Orizaba Nahuatl orta fransız orta ingilis Osetin dili osman ova kricəsi özbək Palatine German palayan pali panqasinan papyamento Pennsylvania German Pikard dili Pipil Polyakca Portuqalca Pulaar Punjabi (Eastern) Punjabi (Western) puştu Pyemont dili Rapa Nui Rendille Rohinca romanş rumın Rus dili Rusin dili saxa samoa Samogitian sanqo sanskrit santal Saraiki sardin Saterland Frisian sebuan sefard serb sesoto Setswana Seyşel Kreol dili Shanghainese Shuswap siciliya Silesian Sindarin sindhi sinhala skots slovak sloven somali sonqa South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tonqo suahili sumeryan sundan Suriya dili Svan Svati dili syan Sylheti Swabian Şimali friz dili şimali sami şona Şotlandiya keltcəsi Tachawit tacik Tagal Murut Tahaggart Tamahaq taxiti taqaloq Talış dili Talossan tamazi tamil Tarifit Tashelhit tatar tay teluqu Temuan Tetun tibet tiqre tiqrin tok pisin Tokelauan tokipona Tonga (Zambezi) tonqa tumbuka Tupinambá Tuvaluan tuvinyan türk türkmən Uab Meto udmurt uels ukrayna umbundu urdu Urhobo uyğur valun varay Veps dili volapük volof Võro vyetnam Yaponca yava yoruba Yucatec Maya yuxarı sorb yunan zaza Zeelandic zulu Wayuu West-Central Oromo Unknown language - Fayl açıqlaması
- Contains additional fields for each sentence (owner name, date created/modified).
- Sahələr və struktur
- Cümlə id-si [tab] Lang [tab] Mətn [tab] İstifadəçi adı [tab] Əlavə edildiyi tarix [tab] Son dəyişdirilən tarix
Original and Translated Sentences
- Fayl adı
- sentences_base.tar.bz2
- Fayl açıqlaması
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Sahələr və struktur
- Cümlə id-si [tab] Base field
Sentences (CC0)
- Fayl adı
-
Bütün dillər Cümlələr ancaq bu dildə: alman Ancient Hebrew belarus Benqal dili Berber bokmal norveç çex çin danimarka esperanto ərəb Ərəb dilinin Əlcəzair dialekti Fin dili foyenik fransız hind Ho holland idiş İdo dili ingilis interlinqua interlinqve İspan dili isveç İtalyan dili ivrit Jewish Babylonian Aramaic Jewish Palestinian Aramaic kabile kanton karel katalan klinqon Konkani (Goan) Kven Finnish qədim nors qədim yunan Láadan latın Liquriya dili Literary Chinese macar Nyungar Odia (Oriya) Old Aramaic Old Frisian orta ingilis Polyakca Portuqalca Rus dili santal sefard Sylheti Tachawit tamazi tokipona uels ukrayna volapük Yaponca Unknown language - Fayl açıqlaması
- Contains all the sentences available under CC0.
- Sahələr və struktur
- Cümlə id-si [tab] Lang [tab] Mətn [tab] Son dəyişdirilən tarix
Linklər
- Fayl adı
- links.tar.bz2
- Fayl açıqlaması
- Contains the links between the sentences. 1 [tab] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [tab] 1.
- Sahələr və struktur
- Cümlə id-si [tab] Tərcümə id-si
Teqlər
- Fayl adı
- tags.tar.bz2
- Fayl açıqlaması
- Contains the list of tags associated with each sentence. 381279 [tab] proverb means that sentence #381279 has been assigned the "proverb" tag.
- Sahələr və struktur
- Cümlə id-si [tab] Adı teq et
Siyahılar
- Fayl adı
- user_lists.tar.bz2
- Fayl açıqlaması
- Contains the list of sentence lists.
- Sahələr və struktur
- Siyahının İD-si [tab] İstifadəçi adı [tab] Yaradıldığı tarix [tab] Son dəyişdirilən tarix [tab] Siyahının adı [tab] Editable by
Siyahılarda cümlələr
- Fayl adı
- sentences_in_lists.tar.bz2
- Fayl açıqlaması
- Indicates the sentences that are contained by any lists. 13 [tab] 381279 means that sentence #381279 is contained by the list that has an id of 13.
- Sahələr və struktur
- Siyahının İD-si [tab] Cümlə id-si
Japanese indices
- Fayl adı
- jpn_indices.tar.bz2
- Fayl açıqlaması
- Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Cümlə id-si refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
- Sahələr və struktur
- Cümlə id-si [tab] Meaning id [tab] Mətn
Səsyazmaları olan cümlələr
- Fayl adı
- sentences_with_audio.tar.bz2
- Fayl açıqlaması
- Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Sahələr və struktur
- Cümlə id-si [tab] Audio id [tab] İstifadəçi adı [tab] Lisenziya [tab] Attribution URL
User skill level per language
- Fayl adı
- user_languages.tar.bz2
- Fayl açıqlaması
- Indicates the self-reported skill levels of members in individual languages.
- Sahələr və struktur
- Lang [tab] Bacarıq səviyyəsi [tab] İstifadəçi adı [tab] Detallar
Users' sentence reviews
- Fayl adı
- users_sentences.csv
- Fayl açıqlaması
- Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
- Sahələr və struktur
- İstifadəçi adı [tab] Cümlə id-si [tab] Review [tab] Əlavə edildiyi tarix [tab] Son dəyişdirilən tarix
Transcriptions
- Fayl adı
-
Bütün dillər Cümlələr ancaq bu dildə: çin kanton özbək Yaponca - Fayl açıqlaması
- Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
- Sahələr və struktur
- Cümlə id-si [tab] Lang [tab] Script name [tab] İstifadəçi adı [tab] Transcription