menu
Tatoeba
language
Registruoti Prisijungti
language Lietuvių
menu
Tatoeba

chevron_right Registruoti

chevron_right Prisijungti

Browse

chevron_right Show random sentence

chevron_right Browse by language

chevron_right Browse by list

chevron_right Browse by tag

chevron_right Browse audio

Community

chevron_right Wall

chevron_right List of all members

chevron_right Languages of members

chevron_right Native speakers

search
clear
swap_horiz
search
warning

Tatoeba will temporarily shut down for maintenance at 04:00 UTC, which is in 16 hours. The maintenance is estimated to take no longer than 1 hours.

Užverti

Note

The data you will find here will NOT be useful unless you are coding a language tool or processing data.

If you simply want sentences that you can use to learn a language, check out the sentence lists. You can build your own, or view the ones that others have created. The lists can be downloaded and printed.

General information about the files

Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.

Creative commons

These files are released under CC BY 2.0 FR.

Creative Commons License CC-BY

A part of our sentences are also available under CC0 1.0.

Creative Commons License CC0

Licenses covering audio

The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.

Questions?

If you have questions or requests, feel free to contact us. In general, we answer quickly.

Atsisiuntimai

arrow_back

Custom exports

Sentence pairs

Use this tool to generate and download customized exports on demand.

translate Sentence pairs
Download all sentences in language A with translations in language B

Download all sentences in language A that are translated into language B, along with the translations.

Weekly exports

info The files provided below are updated every Saturday at 6:30 a.m. (UTC).

Sakiniai

Filename

{{sentences | filename}}

Visos kalbos
Only sentences in: Abazinų kalba Abchazų kalba adygėjų afrihili afrikanų aimarų ainų airių Aklanon albanų albanų kalbos gegų tarmė Alžyro arabų amharų Ancient Hebrew anglų Anišinabų kalba Arabų aragonesų asamų Assyrian Neo-Aramaic asturianų Aukštumų marių kalba aukštutinių sorbų avadhi Avarų kalba azerbaidžaniečių Babilonijos žydų aramėjų kalba Baybayanon baliečių baltarusių baluči bambarų bandžarų baskų baškirų baučpuri bavarų bengalų kalba Berber Berom birmiečių bislama bodo bosnių bretonų Brithenig bulgarų Buriatų kalba Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong centrinio Dusuno Chakasų kalba Chaladžų kalba Chavacano Chinese Pidgin English Chinyanja CycL Coastal Kadazan Cuyonon čagatų čamorų čečėnų čekų čerokių Čigonų kalba činuk žargonas Čiukčių kalba čiuvašų čoktau danų Drents Dungan Dutton World Speedwords Eastern Armenian Egipto Arabų Erromintxela erzyjų esperanto estų Evenkų kalba evių farerų Fidžio hindi fidžių finikiečių Frisian friulių ga gagaūzų galisų Garhwali gotų graikų Grenlandų kalba Gronings gruzinų Guadeloupean Creole French gudžaratų Guerrero Nahuatl Gulf Arabic Gun gvaranių Haičio haido hausų havajiečių hebrajų hiligainonų hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho Hunsrik I kalba iban Ido igbų Ilocano indoneziečių ingrų Interglosa interkalba Interslavic inukitut Irako Arabų Isan islandų Ispanų ispanų kalbos Ekstremadūros tarmė Italų italų kalbos Emilijos tarmė italų kalbos Pjemonto tarmė jakutų Jamaican Patois Japonų javiečių Jewish Palestinian Aramaic Jidiš Jin Chinese jorubų Juhuri (Judeo-Tat) Jukatekų majų kalba K'iche' kabardinų kaijūgų kalmukų kanadų Kapampangan karačiajų balkarijos Karakalpakų kalba Karakhanid karelų kasi Kaškajų kalba kašmyrų kašubų katalonų kazachų kebailų kečujų Kekchi (Q'eqchi') Kelantan-Pattani Malay kembų Keningau Murut khmerų kinjaruandų kinų kinų kalbos dziangsi tarmė kinų kalbos hakų tarmė kinų kalbos hunano tarmė kinų kalbos Kantono tarmė kinų kalbos pietų minų tarmė kirgizų kiribati Kirundi klingonų Kölsch Komi-Zyrian komių-permių Kongo suahilių Konkani (Goan) Korėjiečių kornų korsikiečių kosų kotava Krymo totorių kalba kroatų kumikų Kven Finnish Láadan ladino Ladinų kalba lakotų laosiečių latgalių Latvių kalba laz Lenkų Lezgi Libyan Arabic Lietuvių ligūrų limburgiečių Literatūrinė Kinų liuksemburgiečių lyvių loiban lombardų lotynų Low German (Low Saxon) Luganda Luizianos kreolų Lushootseed madurezų Mahasu Pahari maithili makedonų malagasų Malay (Vernacular) malajalių malajiečių Maldyvų kalba maltiečių Mambae manču Manipūri maorių mapudungunų maratų Maroko arabų Maršalo Salų Meadow Mari megrelų meniečių Middle Persian (Pahlavi) mikmakų minangkabau mirandezų mohok mokša mongolų Mono (USA) Monų kalba morisijų Muskogee (Creek) Naga (Tangshang) Nahuatl Nande naujoji frankų kalba naujoji norvegų Nauriečių kalba navajų neapoliečių nepaliečių nevari ngalų Ngeq Nigerian Fulfulde niujiečių Nyungar nogų North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvegų bukmolas novial nuerų O'odham očitarų Odia (Oriya) Okinavų kalba olandų Old Aramaic Old Frisian Old Saxon Old Spanish Old Turkish Orizaba Nahuatl Osetinų kalba osmanų turkų palauliečių pali pangasinanų papiamento Papua pidžinų Pensilvanijos vokiečių persų pietų Altajaus Pietų Haidos pietų kurdų pietų samių pietų Soto pikardų Pipil Portugalų prancūzų Prūsų kalba Pulaar Punjabi (Eastern) Punjabi (Western) puštūnų Quenya Rapa Nui Rendille retoromanų rochindža Rumunų rusinų rusų Samoa sango sanskritas santalių Saraikių kalba sardiniečių Saterlendo fryzų sebuanų Seychellois Creole senoji anglų senoji norsų senoji prancūzų Senoji rusų kalba senovės graikų serbų Setswana Shanghainese Shuswap siciliečių sileziečių Sylheti Sindarin sindų sinhalų Sirų kalba slovakų slovėnų somaliečių South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tongo standartinė Maroko tamazigtų suahilių sundų suomių supraprastinta kri Svazių kalba Swabian Šiaurės fryzų kalba šiaurės samių Šilhų kalba škotų škotų (gėlų) šonų šumerų švedų Šveicarijos vokiečių Tachawit tadžikų Tagal Murut tagalogų Tahaggart Tamahaq taitiečių tajų talyšų Talossan tamilų Tarifit tarpinė telugų Temuan Tetun tibetiečių tigrajų tigre Tokelauan Toki Pona Tonga (Zambezi) tonganų totorių tsongų tumbukų Tupinambá turkmėnų Turkų Tuvaliečių kalba tuvių Uab Meto udmurtų uigūrų ukrainiečių umbundu urdų Urhobo uzbekų vajų Vakarų armėnų kalba valonų valų varai venetų vengrų vepsų veru Vidurio Anglijos Vidurio Prancūzijos vietnamiečių vokiečių vokiečių kalbos Pfalco tarmė volapiuko volofų West-Central Oromo zaza zelandų zulų žemaičių žemutinių sorbų Unknown language
File description
Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
Fields and structure
Sakinio ID [tab] Kalba [tab] Text

Detailed Sentences

Filename

{{sentencesDetailed | filename}}

Visos kalbos
Only sentences in: Abazinų kalba Abchazų kalba adygėjų afrihili afrikanų aimarų ainų airių Aklanon albanų albanų kalbos gegų tarmė Alžyro arabų amharų Ancient Hebrew anglų Anišinabų kalba Arabų aragonesų asamų Assyrian Neo-Aramaic asturianų Aukštumų marių kalba aukštutinių sorbų avadhi Avarų kalba azerbaidžaniečių Babilonijos žydų aramėjų kalba Baybayanon baliečių baltarusių baluči bambarų bandžarų baskų baškirų baučpuri bavarų bengalų kalba Berber Berom birmiečių bislama bodo bosnių bretonų Brithenig bulgarų Buriatų kalba Central Bikol Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong centrinio Dusuno Chakasų kalba Chaladžų kalba Chavacano Chinese Pidgin English Chinyanja CycL Coastal Kadazan Cuyonon čagatų čamorų čečėnų čekų čerokių Čigonų kalba činuk žargonas Čiukčių kalba čiuvašų čoktau danų Drents Dungan Dutton World Speedwords Eastern Armenian Egipto Arabų Erromintxela erzyjų esperanto estų Evenkų kalba evių farerų Fidžio hindi fidžių finikiečių Frisian friulių ga gagaūzų galisų Garhwali gotų graikų Grenlandų kalba Gronings gruzinų Guadeloupean Creole French gudžaratų Guerrero Nahuatl Gulf Arabic Gun gvaranių Haičio haido hausų havajiečių hebrajų hiligainonų hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) Ho Hunsrik I kalba iban Ido igbų Ilocano indoneziečių ingrų Interglosa interkalba Interslavic inukitut Irako Arabų Isan islandų Ispanų ispanų kalbos Ekstremadūros tarmė Italų italų kalbos Emilijos tarmė italų kalbos Pjemonto tarmė jakutų Jamaican Patois Japonų javiečių Jewish Palestinian Aramaic Jidiš Jin Chinese jorubų Juhuri (Judeo-Tat) Jukatekų majų kalba K'iche' kabardinų kaijūgų kalmukų kanadų Kapampangan karačiajų balkarijos Karakalpakų kalba Karakhanid karelų kasi Kaškajų kalba kašmyrų kašubų katalonų kazachų kebailų kečujų Kekchi (Q'eqchi') Kelantan-Pattani Malay kembų Keningau Murut khmerų kinjaruandų kinų kinų kalbos dziangsi tarmė kinų kalbos hakų tarmė kinų kalbos hunano tarmė kinų kalbos Kantono tarmė kinų kalbos pietų minų tarmė kirgizų kiribati Kirundi klingonų Kölsch Komi-Zyrian komių-permių Kongo suahilių Konkani (Goan) Korėjiečių kornų korsikiečių kosų kotava Krymo totorių kalba kroatų kumikų Kven Finnish Láadan ladino Ladinų kalba lakotų laosiečių latgalių Latvių kalba laz Lenkų Lezgi Libyan Arabic Lietuvių ligūrų limburgiečių Literatūrinė Kinų liuksemburgiečių lyvių loiban lombardų lotynų Low German (Low Saxon) Luganda Luizianos kreolų Lushootseed madurezų Mahasu Pahari maithili makedonų malagasų Malay (Vernacular) malajalių malajiečių Maldyvų kalba maltiečių Mambae manču Manipūri maorių mapudungunų maratų Maroko arabų Maršalo Salų Meadow Mari megrelų meniečių Middle Persian (Pahlavi) mikmakų minangkabau mirandezų mohok mokša mongolų Mono (USA) Monų kalba morisijų Muskogee (Creek) Naga (Tangshang) Nahuatl Nande naujoji frankų kalba naujoji norvegų Nauriečių kalba navajų neapoliečių nepaliečių nevari ngalų Ngeq Nigerian Fulfulde niujiečių Nyungar nogų North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvegų bukmolas novial nuerų O'odham očitarų Odia (Oriya) Okinavų kalba olandų Old Aramaic Old Frisian Old Saxon Old Spanish Old Turkish Orizaba Nahuatl Osetinų kalba osmanų turkų palauliečių pali pangasinanų papiamento Papua pidžinų Pensilvanijos vokiečių persų pietų Altajaus Pietų Haidos pietų kurdų pietų samių pietų Soto pikardų Pipil Portugalų prancūzų Prūsų kalba Pulaar Punjabi (Eastern) Punjabi (Western) puštūnų Quenya Rapa Nui Rendille retoromanų rochindža Rumunų rusinų rusų Samoa sango sanskritas santalių Saraikių kalba sardiniečių Saterlendo fryzų sebuanų Seychellois Creole senoji anglų senoji norsų senoji prancūzų Senoji rusų kalba senovės graikų serbų Setswana Shanghainese Shuswap siciliečių sileziečių Sylheti Sindarin sindų sinhalų Sirų kalba slovakų slovėnų somaliečių South Levantine Arabic Southern Subanen Southern Zaza (Dimli) sranan tongo standartinė Maroko tamazigtų suahilių sundų suomių supraprastinta kri Svazių kalba Swabian Šiaurės fryzų kalba šiaurės samių Šilhų kalba škotų škotų (gėlų) šonų šumerų švedų Šveicarijos vokiečių Tachawit tadžikų Tagal Murut tagalogų Tahaggart Tamahaq taitiečių tajų talyšų Talossan tamilų Tarifit tarpinė telugų Temuan Tetun tibetiečių tigrajų tigre Tokelauan Toki Pona Tonga (Zambezi) tonganų totorių tsongų tumbukų Tupinambá turkmėnų Turkų Tuvaliečių kalba tuvių Uab Meto udmurtų uigūrų ukrainiečių umbundu urdų Urhobo uzbekų vajų Vakarų armėnų kalba valonų valų varai venetų vengrų vepsų veru Vidurio Anglijos Vidurio Prancūzijos vietnamiečių vokiečių vokiečių kalbos Pfalco tarmė volapiuko volofų West-Central Oromo zaza zelandų zulų žemaičių žemutinių sorbų Unknown language
File description
Contains additional fields for each sentence (owner name, date created/modified).
Fields and structure
Sakinio ID [tab] Kalba [tab] Text [tab] Naudotojo vardas [tab] Date added [tab] Date last modified

Original and Translated Sentences

Filename
sentences_base.tar.bz2
File description
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
  • zero: The sentence is original, not a translation of another.
  • greater than zero: The id of the sentence from which it was translated.
  • \N: Unknown (rare).
Fields and structure
Sakinio ID [tab] Base field

Sentences (CC0)

Filename

{{sentencesCC0 | filename}}

Visos kalbos
Only sentences in: Alžyro arabų Ancient Hebrew anglų Arabų Babilonijos žydų aramėjų kalba baltarusių bengalų kalba Berber čekų danų esperanto finikiečių hebrajų hindi Ho Ido interkalba Ispanų Italų Japonų Jewish Palestinian Aramaic Jidiš karelų katalonų kebailų kinų kinų kalbos Kantono tarmė klingonų Konkani (Goan) Kven Finnish Láadan ladino Lenkų ligūrų Literatūrinė Kinų lotynų Nyungar norvegų bukmolas Odia (Oriya) olandų Old Aramaic Old Frisian Portugalų prancūzų rusų santalių senoji norsų senovės graikų Sylheti standartinė Maroko tamazigtų suomių švedų Tachawit tarpinė Toki Pona ukrainiečių valų vengrų Vidurio Anglijos vokiečių volapiuko Unknown language
File description
Contains all the sentences available under CC0.
Fields and structure
Sakinio ID [tab] Kalba [tab] Text [tab] Date last modified

Links

Filename
links.tar.bz2
File description
Contains the links between the sentences. 1 [tab] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [tab] 1.
Fields and structure
Sakinio ID [tab] Translation id

Tags

Filename
tags.tar.bz2
File description
Contains the list of tags associated with each sentence. 381279 [tab] proverb means that sentence #381279 has been assigned the "proverb" tag.
Fields and structure
Sakinio ID [tab] Tag name

Lists

Filename
user_lists.tar.bz2
File description
Contains the list of sentence lists.
Fields and structure
List id [tab] Naudotojo vardas [tab] Date created [tab] Date last modified [tab] List name [tab] Editable by

Sentences in lists

Filename
sentences_in_lists.tar.bz2
File description
Indicates the sentences that are contained by any lists. 13 [tab] 381279 means that sentence #381279 is contained by the list that has an id of 13.
Fields and structure
List id [tab] Sakinio ID

Japanese indices

Filename
jpn_indices.tar.bz2
File description
Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Sakinio ID refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
Fields and structure
Sakinio ID [tab] Meaning id [tab] Text

Sentences with audio

Filename
sentences_with_audio.tar.bz2
File description
Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
Downloading audio
A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
Fields and structure
Sakinio ID [tab] Audio id [tab] Naudotojo vardas [tab] License [tab] Attribution URL

Naudotojo įgūdžių lygis kiekvienai kalbai

Filename
user_languages.tar.bz2
File description
Indicates the self-reported skill levels of members in individual languages.
Fields and structure
Kalba [tab] Skill level [tab] Naudotojo vardas [tab] Details

Naudotojo sakinių apžvalgos

Filename
users_sentences.csv
File description
Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
Fields and structure
Naudotojo vardas [tab] Sakinio ID [tab] Review [tab] Date added [tab] Date last modified

Transcriptions

Filename

{{transcriptions | filename}}

Visos kalbos
Only sentences in: Japonų kinų kinų kalbos Kantono tarmė uzbekų
File description
Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
Fields and structure
Sakinio ID [tab] Kalba [tab] Script name [tab] Naudotojo vardas [tab] Transcription