Not
The data you will find here will NOT be useful unless you are coding a language tool or processing data.
If you simply want sentences that you can use to learn a language, check out the sentence lists. You can build your own, or view the ones that others have created. The lists can be downloaded and printed.
Di derbarê pelgeyan de agahiyên giştî
Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.
Creative commons
These files are released under CC BY 2.0 FR.
A part of our sentences are also available under CC0 1.0.
Licenses covering audio
The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.
Pirs?
If you have questions or requests, feel free to contact us. In general, we answer quickly.
Daxistin
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Hevok
- Navê pelgeyê
-
Hemû ziman Tenê hevokên di: Abaza Abxazî Adîgeyî Afrihilî Afrîkansî Ainuyî Aklanonî Almaniya Jêrîn (Saksoniya Jêrîn) Almaniya Palatînê Almaniya Pensîlvaniyayê Almaniya Swîsreyê Almanî Altayiya Başûr amazîxiya fasî Amharî Ancient Hebrew Ao Naga Aragonî Aramiya Babîlê ya Cihûyan Aramiya Kevn Arnawidiya Ghegê Arnawidî (Albanî) Assamese Asûrî Asûrî (Aramiya-Nû) Avar Awadhî Aymarayî Azerî Balînî Bambarayî Banjarî Baskî Başxarî Bavarî Baybayanî Belarûsî Bengalî Berberiya Kabyleê Berberî Berom Bhojpurî Bislamayî Bodoyî Bosnayî Bretonî Brithenigî Burmeyî Buryatî Bûlgarî Central Bikol Central Huasteca Nahuatl Central Kanuri Chavacano Chinook Jargon Cuhûrî (Tatiya Cihûyan) Cuyonon CycL Çamorroyî Çaxatayî Çeçenî Çekî Çerokî Çevacayî Çîniya Ganê Çîniya Hakkayê Çîniya Jînê Çîniya Mandarinê Çîniya Min-Nanê Çîniya Wêjeyî Çîniya Xiangê Çoktawî Çuvaşî Çûkçiyî Danîmarkî dargînî Devoka Jamaîkayê Dhivehi Drents Dungan Dusuniya Navendî Dutton World Speedwords Eastern Armenian Emiliayî Erebiya Cezayirê Erebiya Fasê Erebiya Iraqê Erebiya Kendavê Erebiya Levantîna Bakur Erebiya Libyayê Erebiya Misirê Erebî Ermeniya rojavayî Erromintxela Erzyayî Esperantoyî Estonî Evenkî Ewe Extremaduran Farisî Faroesî Fîjî Fîniya Kvenê Fînî fînîkî Flemenkî Fransî Frensiya Kevn Frensiya Navîn Friskî Friulian Frîsiya Bakur Frîsiya Kevin Frîsiya Saterlandê Gagavûzî Galî Galîsyayî Garhwalî Gayî Gotî Grînlandî Groningî Guadeloupean Creole French Guaranî Guerrero Nahuatl Gujaratî Gun Gurcî haîdaya başûrî Hawaiyî Hawsayî haydayî Hiligaynonî Hindiya Fîjiyê Hindî Hitchiti Hmong Daw (White) Hmong Njua (Green) Hoyî Hunsrikî Ibanî İdo Igboyî Ingrî Interglossa Interlingua Interlingue Interslavic Inuktitutî Irlandî Isanî Îbranî Îlokanoyî Îndonezî Îngilîziya Kevn Îngilîziya Navîn Îngilîziya Pidgin-Çînê Îngilîzî Îtalî Îzlandî Japonî Javanesî Jewish Palestinian Aramaic K'iche' Kadazaniya peravî Kalmikî Kambayî Kanadayî Kantonî (Çînî) Kapampanganî Karakalpakî Karakhanid Karelî Kaşûbî Katalanî Kayugayî Keçuwayî Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Keşmîrî Khalaj Kinyarwandayî Kirgizî Kiribatî Kirundiyî Klingonî Kolnî Komi-Permyak Komi-Zyrian Konkanî (Goan) Koreyî Kornîşî Korsîkayî Kotavayî Kreoliya Haîtiyî kriya bejayî Kurdî (Kelhûrî) Kurdî (Kirmanckî) Kurdî (Kurmancî) Kurdî (Soranî) Kûmûkî Láadan Ladinoyî Ladînî Lakotayî Laoyî Latgalî Latînî Lazî Letonî Lezgi Liguriyî Lingalayî Lingua Franca Nova lîmbûrgî Lîtvanî Lîvonî Lojbanî Lombardî Louisiana Creole Lugandayî Luksembûrgî Lushootseed Macarî Madurayî Mahasu Pahari Maithiliyî Makedonî Malayalamî Malayiya Molukana Bakurî Malayî Malayî (Xwecihî) Maltayî Mambae Mançuyî Mandar Manksî Maorî mapuçî Maratî Mariya Çiyê Mariya Deştî Marşhalî Meitei Melegasî Mikmaqî Minangkabauyî Mingrelî Mirandayî Mnongiya Navendî Mohawkî Mokşayî Monî Mono (USA) Morisyenî Moxolî Muskogee (Creek) Nagayî (Tangshang) Nahuatlî Nande napolîtanî Naûrûyî Navacoyî Nepalî Newarî Ngeqî Nigerian Fulfulde Niueyî Nogayî Norsiya Kevn Northern Zaza (Kirmanjki) Norwêciya Bokmalê Norwêciya Nynorskê Novial Nuerî Nuosu Nyungarî O'odham Odîa (Oriya) Ojibweyî Okinawanî Oksitanî Orizaba Nahuatl Osetî Ozbekî Palauan Pali Pangasinan Papiamentoyî Pencabî (Rajava) Pencabî (Rojhilat) Persiya Navîn (Pehlewî) Peştûyî Picardî Pipilî Piyemonteyî Polandî Portekizî Prûsiya Kevn Pulaar Qashqai Qazakî Qereçay-Balkarî Quenya Rapa Nui Rendille rohingyayî Romanî Romanî Romanşî Rusyn Rûsî Sabûanî Saksoniya Kevn Samiya Bakurî Samiya Başûr Samoayî Samogitî Sangoyî Sanskrîtî santalî Saraiki Sardûyî Setswanayî Seychellois Creole Sindarinî Sindî Sinhalî sirananî Sirbî Sîcîlyayî Skotî Slaviya Rojhilata Kevn Slovakî Slovenî Somalî Sorbiya Jêrîn Sorbiya Jorîn Sothoyiya Başûr South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Spaniya Kevn Spanî Sundayî Suryanî Sûmerî Svan Swabî swahiliya kongoyî Swahîlî Swazî Swêdî Şangayî Şonayî Şûswapî Tacîkî Tagal Murut Tagalogî Tahaggart Tamahaq Tahitî Takawitî Talişî Talossan Tamîlî Tarifit Tatariya Kirimê Tatarî Teluguyî Temuanî Tetunî Thayî Tigreyî Tigrinyayî Tirkiya Kevn Tirkiya Osmanî Tirkî Tirkmenî Tîbetî Tok Pisin Tokelauan Toki Pona Tonga (Zambezi) Tongayî Tsongayî tumbukayî Tupinambá Tuvalûyî Tuvinian Uab Meto Udmurtî Umbunduyî Urhoboyî Ûkraynî Ûrdûyî Ûygûrî Venedîkî Vepsî Vîetnamî Volapukî Voroyî Walonî Warayî Wayuu West-Central Oromo Wolofî Xakasî Xasî Xhosayî Xirwatî Xîmerî Yaqûtî Yewnanî Yewnanî Kevnar Yîddîşî Yorûbayî Yucatec Maya Zeelandic Zimanê belûçî Zimanê silesî Zimanê Sîlotî Zimanê Skotî Zimanê taşelhît Zimanên çerkezî Zûlûyî Zimanê nenas - Raveya pelgeyê
- Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
- Fields and structure
- Hejmara hevokê [hilpek] Ziman [hilpek] Nivîs
Hevokên bi Hûrgilî
- Navê pelgeyê
-
{{sentencesDetailed | filename}}
Hemû ziman Tenê hevokên di: Abaza Abxazî Adîgeyî Afrihilî Afrîkansî Ainuyî Aklanonî Almaniya Jêrîn (Saksoniya Jêrîn) Almaniya Palatînê Almaniya Pensîlvaniyayê Almaniya Swîsreyê Almanî Altayiya Başûr amazîxiya fasî Amharî Ancient Hebrew Ao Naga Aragonî Aramiya Babîlê ya Cihûyan Aramiya Kevn Arnawidiya Ghegê Arnawidî (Albanî) Assamese Asûrî Asûrî (Aramiya-Nû) Avar Awadhî Aymarayî Azerî Balînî Bambarayî Banjarî Baskî Başxarî Bavarî Baybayanî Belarûsî Bengalî Berberiya Kabyleê Berberî Berom Bhojpurî Bislamayî Bodoyî Bosnayî Bretonî Brithenigî Burmeyî Buryatî Bûlgarî Central Bikol Central Huasteca Nahuatl Central Kanuri Chavacano Chinook Jargon Cuhûrî (Tatiya Cihûyan) Cuyonon CycL Çamorroyî Çaxatayî Çeçenî Çekî Çerokî Çevacayî Çîniya Ganê Çîniya Hakkayê Çîniya Jînê Çîniya Mandarinê Çîniya Min-Nanê Çîniya Wêjeyî Çîniya Xiangê Çoktawî Çuvaşî Çûkçiyî Danîmarkî dargînî Devoka Jamaîkayê Dhivehi Drents Dungan Dusuniya Navendî Dutton World Speedwords Eastern Armenian Emiliayî Erebiya Cezayirê Erebiya Fasê Erebiya Iraqê Erebiya Kendavê Erebiya Levantîna Bakur Erebiya Libyayê Erebiya Misirê Erebî Ermeniya rojavayî Erromintxela Erzyayî Esperantoyî Estonî Evenkî Ewe Extremaduran Farisî Faroesî Fîjî Fîniya Kvenê Fînî fînîkî Flemenkî Fransî Frensiya Kevn Frensiya Navîn Friskî Friulian Frîsiya Bakur Frîsiya Kevin Frîsiya Saterlandê Gagavûzî Galî Galîsyayî Garhwalî Gayî Gotî Grînlandî Groningî Guadeloupean Creole French Guaranî Guerrero Nahuatl Gujaratî Gun Gurcî haîdaya başûrî Hawaiyî Hawsayî haydayî Hiligaynonî Hindiya Fîjiyê Hindî Hitchiti Hmong Daw (White) Hmong Njua (Green) Hoyî Hunsrikî Ibanî İdo Igboyî Ingrî Interglossa Interlingua Interlingue Interslavic Inuktitutî Irlandî Isanî Îbranî Îlokanoyî Îndonezî Îngilîziya Kevn Îngilîziya Navîn Îngilîziya Pidgin-Çînê Îngilîzî Îtalî Îzlandî Japonî Javanesî Jewish Palestinian Aramaic K'iche' Kadazaniya peravî Kalmikî Kambayî Kanadayî Kantonî (Çînî) Kapampanganî Karakalpakî Karakhanid Karelî Kaşûbî Katalanî Kayugayî Keçuwayî Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Keşmîrî Khalaj Kinyarwandayî Kirgizî Kiribatî Kirundiyî Klingonî Kolnî Komi-Permyak Komi-Zyrian Konkanî (Goan) Koreyî Kornîşî Korsîkayî Kotavayî Kreoliya Haîtiyî kriya bejayî Kurdî (Kelhûrî) Kurdî (Kirmanckî) Kurdî (Kurmancî) Kurdî (Soranî) Kûmûkî Láadan Ladinoyî Ladînî Lakotayî Laoyî Latgalî Latînî Lazî Letonî Lezgi Liguriyî Lingalayî Lingua Franca Nova lîmbûrgî Lîtvanî Lîvonî Lojbanî Lombardî Louisiana Creole Lugandayî Luksembûrgî Lushootseed Macarî Madurayî Mahasu Pahari Maithiliyî Makedonî Malayalamî Malayiya Molukana Bakurî Malayî Malayî (Xwecihî) Maltayî Mambae Mançuyî Mandar Manksî Maorî mapuçî Maratî Mariya Çiyê Mariya Deştî Marşhalî Meitei Melegasî Mikmaqî Minangkabauyî Mingrelî Mirandayî Mnongiya Navendî Mohawkî Mokşayî Monî Mono (USA) Morisyenî Moxolî Muskogee (Creek) Nagayî (Tangshang) Nahuatlî Nande napolîtanî Naûrûyî Navacoyî Nepalî Newarî Ngeqî Nigerian Fulfulde Niueyî Nogayî Norsiya Kevn Northern Zaza (Kirmanjki) Norwêciya Bokmalê Norwêciya Nynorskê Novial Nuerî Nuosu Nyungarî O'odham Odîa (Oriya) Ojibweyî Okinawanî Oksitanî Orizaba Nahuatl Osetî Ozbekî Palauan Pali Pangasinan Papiamentoyî Pencabî (Rajava) Pencabî (Rojhilat) Persiya Navîn (Pehlewî) Peştûyî Picardî Pipilî Piyemonteyî Polandî Portekizî Prûsiya Kevn Pulaar Qashqai Qazakî Qereçay-Balkarî Quenya Rapa Nui Rendille rohingyayî Romanî Romanî Romanşî Rusyn Rûsî Sabûanî Saksoniya Kevn Samiya Bakurî Samiya Başûr Samoayî Samogitî Sangoyî Sanskrîtî santalî Saraiki Sardûyî Setswanayî Seychellois Creole Sindarinî Sindî Sinhalî sirananî Sirbî Sîcîlyayî Skotî Slaviya Rojhilata Kevn Slovakî Slovenî Somalî Sorbiya Jêrîn Sorbiya Jorîn Sothoyiya Başûr South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Spaniya Kevn Spanî Sundayî Suryanî Sûmerî Svan Swabî swahiliya kongoyî Swahîlî Swazî Swêdî Şangayî Şonayî Şûswapî Tacîkî Tagal Murut Tagalogî Tahaggart Tamahaq Tahitî Takawitî Talişî Talossan Tamîlî Tarifit Tatariya Kirimê Tatarî Teluguyî Temuanî Tetunî Thayî Tigreyî Tigrinyayî Tirkiya Kevn Tirkiya Osmanî Tirkî Tirkmenî Tîbetî Tok Pisin Tokelauan Toki Pona Tonga (Zambezi) Tongayî Tsongayî tumbukayî Tupinambá Tuvalûyî Tuvinian Uab Meto Udmurtî Umbunduyî Urhoboyî Ûkraynî Ûrdûyî Ûygûrî Venedîkî Vepsî Vîetnamî Volapukî Voroyî Walonî Warayî Wayuu West-Central Oromo Wolofî Xakasî Xasî Xhosayî Xirwatî Xîmerî Yaqûtî Yewnanî Yewnanî Kevnar Yîddîşî Yorûbayî Yucatec Maya Zeelandic Zimanê belûçî Zimanê silesî Zimanê Sîlotî Zimanê Skotî Zimanê taşelhît Zimanên çerkezî Zûlûyî Zimanê nenas - Raveya pelgeyê
- Contains additional fields for each sentence (owner name, date created/modified).
- Fields and structure
- Hejmara hevokê [hilpek] Ziman [hilpek] Nivîs [hilpek] Navê bikarhêner [hilpek] Dema tevlîkirinê [hilpek] Dema guhertina dawîn
Original and Translated Sentences
- Navê pelgeyê
- sentences_base.tar.bz2
- Raveya pelgeyê
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Fields and structure
- Hejmara hevokê [hilpek] Base field
Hevok (CC0)
- Navê pelgeyê
-
Hemû ziman Tenê hevokên di: Almanî amazîxiya fasî Ancient Hebrew Aramiya Babîlê ya Cihûyan Aramiya Kevn Belarûsî Bengalî Berberiya Kabyleê Berberî Çekî Çîniya Mandarinê Çîniya Wêjeyî Danîmarkî Erebiya Cezayirê Erebî Esperantoyî Fîniya Kvenê Fînî fînîkî Flemenkî Fransî Frîsiya Kevin Galî Hindî Hoyî İdo Interlingua Interlingue Îbranî Îngilîziya Navîn Îngilîzî Îtalî Japonî Jewish Palestinian Aramaic Kantonî (Çînî) Karelî Katalanî Klingonî Konkanî (Goan) Láadan Ladinoyî Latînî Liguriyî Macarî Norsiya Kevn Norwêciya Bokmalê Nyungarî Odîa (Oriya) Polandî Portekizî Rûsî santalî Spanî Swêdî Takawitî Toki Pona Ûkraynî Volapukî Yewnanî Kevnar Yîddîşî Zimanê Sîlotî Zimanê nenas - Raveya pelgeyê
- Contains all the sentences available under CC0.
- Fields and structure
- Hejmara hevokê [hilpek] Ziman [hilpek] Nivîs [hilpek] Dema guhertina dawîn
Girêdan
- Navê pelgeyê
- links.tar.bz2
- Raveya pelgeyê
- Contains the links between the sentences. 1 [hilpek] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [hilpek] 1.
- Fields and structure
- Hejmara hevokê [hilpek] Hejmara wergerê
Etîket
- Navê pelgeyê
- tags.tar.bz2
- Raveya pelgeyê
- Contains the list of tags associated with each sentence. 381279 [hilpek] proverb means that sentence #381279 has been assigned the "proverb" tag.
- Fields and structure
- Hejmara hevokê [hilpek] Navê etîketê
Lîste
- Navê pelgeyê
- user_lists.tar.bz2
- Raveya pelgeyê
- Contains the list of sentence lists.
- Fields and structure
- Hejmara lîsteyê [hilpek] Navê bikarhêner [hilpek] Dema afirandinê [hilpek] Dema guhertina dawîn [hilpek] Navê lîsteyê [hilpek] Editable by
Hevokên di lîsteyan de
- Navê pelgeyê
- sentences_in_lists.tar.bz2
- Raveya pelgeyê
- Indicates the sentences that are contained by any lists. 13 [hilpek] 381279 means that sentence #381279 is contained by the list that has an id of 13.
- Fields and structure
- Hejmara lîsteyê [hilpek] Hejmara hevokê
Japanese indices
- Navê pelgeyê
- jpn_indices.tar.bz2
- Raveya pelgeyê
- Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Hejmara hevokê refers to the id of the Japanese sentence. Hejmara naverokê refers to the id of the English sentence.
- Fields and structure
- Hejmara hevokê [hilpek] Hejmara naverokê [hilpek] Nivîs
Hevokên bi deng
- Navê pelgeyê
- sentences_with_audio.tar.bz2
- Raveya pelgeyê
- Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Fields and structure
- Hejmara hevokê [hilpek] Audio id [hilpek] Navê bikarhêner [hilpek] Lîsans [hilpek] Attribution URL
Li gorî zimên asta jîrbûnê ya bikarhêner
- Navê pelgeyê
- user_languages.tar.bz2
- Raveya pelgeyê
- Indicates the self-reported skill levels of members in individual languages.
- Fields and structure
- Ziman [hilpek] Asta jîrbûnê [hilpek] Navê bikarhêner [hilpek] Hûrgilî
Nirxandinên hevokan ên bikarhêneran
- Navê pelgeyê
- users_sentences.csv
- Raveya pelgeyê
- Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
- Fields and structure
- Navê bikarhêner [hilpek] Hejmara hevokê [hilpek] Binirxîne [hilpek] Dema tevlîkirinê [hilpek] Dema guhertina dawîn
Transkripsiyon
- Navê pelgeyê
-
Hemû ziman Tenê hevokên di: Çîniya Mandarinê Japonî Kantonî (Çînî) Ozbekî - Raveya pelgeyê
- Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
- Fields and structure
- Hejmara hevokê [hilpek] Ziman [hilpek] Navê scriptê [hilpek] Navê bikarhêner [hilpek] Transkripsiyon