Note
Datan du hittar här kommer INTE vara användbar såvida du inte programmerar ett verktyg eller behandlar data.
If you simply want sentences that you can use to learn a language, check out the sentence lists. You can build your own, or view the ones that others have created. The lists can be downloaded and printed.
General information about the files
Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.
Creative commons
These files are released under CC BY 2.0 FR.
A part of our sentences are also available under CC0 1.0.
Licenses covering audio
The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.
Frågor?
If you have questions or requests, feel free to contact us. In general, we answer quickly.
Nedladdningar
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Meningar
- Filnamn
-
Alla språk Endast meningar på: abchaziska adygeiska afghanska afrihili afrikaans ainu aklan albanska algerisk arabiska amhariska Ancient Hebrew arabiska aragonesiska assamesiska asturiska avariska awadhi aymara azerbajdzjanska balinesiska baluchiska bambara banjariska basjkiriska baskiska Baybayanon bayerska belarusiska bengali berber berom bhojpuri bislama bodo bosniska bretonska Brithenig bulgariska burjatiska burmesiska cayuga cebuano Central Huasteca Nahuatl Central Kanuri Central Mnong centralbikol centraldusun centralkurdiska (sorani) chagatai chamorro chavacano cherokesiska chinook Chinyanja choctaw Coastal Kadazan Cuyonon cycL danska Divehi Drents dunganska Dutton World Speedwords egyptisk arabiska emiliska engelska erjya Erromintxela esperanto estniska evenki (språk) ewe extremaduriska feniciska Fiji-hindi fijianska finska fornarameiska fornengelska fornfranska Fornfrisiska forngrekiska fornnordiska Fornsaxiska fornspanska forntupi Fornöstslaviska franska frisiska friulianska färöiska gã gagauziska galiciska gan garhwali gegiska georgiska gilbertiska gotiska grekiska Gronings grönländska Guadeloupean Creole French guaraní Guerrero Nahuatl gujarati gulfarabiska haida haitiska hakka hausa hawaiiska hebreiska hiligaynon hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) ho högsorbiska ibanska ido igbo Ilokano indonesiska ingriska Interglossa interlingua interlingue inuktitut irakisk arabiska iriska Isan isländska italienska jakutiska japanska javanesiska Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddisch jin Juhuri (Judeo-Tat) K'iche' kabardinska kabyliska kalmuckiska kamba kambodjanska kannada kantonesiska karachay-balkar Karakalpakiska Karakhanid karelska kashmiriska kasjubiska katalanska kazakiska Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut khakasiska Khalaj khasi kinesiska kinjarwanda kirgisiska Kirundi klingonska komi-permjakiska Komi-syrjänska Kongo-swahili Konkani (Goan) koreanska korniska korsikanska kotava Krimtatariska kroatiska kumykiska kvänska kölsch Láadan ladino ladinska lakota laotiska latin laziska lettgalliska lettiska Libyan Arabic liguriska limburgiska lingala lingua franca nova litauiska litterär kinesiska livoniska lojban lombardiska louisiana-kreol Luganda Lushootseed luxemburgiska lågsorbiska lågtyska (lågsaxiska) maduresiska Mahasu Pahari maithili makedonska malagassiska malajiska Malay (Vernacular) malayalam maltesiska Mambae manchuriska manx maori mapudungun marathi marockansk arabiska marockansk standard-tamazight marshalliska mauritansk kreol medelengelska medelfranska Meitei mi’kmaq Middle Persian (Pahlavi) min nan minangkabau mingrelianska mirandesiska mohawk moksja mon mongoliska Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl nande napolitanska nauruanska navaho nederländska nepalesiska newariska Ngeq Nigerian Fulfulde niueanska nogai Nordfrisiska nordkurdiska (kurmanji) nordlevantinsk arabiska nordsamiska norskt bokmål North Moluccan Malay Northern Zaza (Kirmanjki) novial nuer nuosu nynorska Nyungar Nyöstsyriska O'odham occitanska Odia (Oriya) Ojibwa okinawianska Old Turkish Orizaba Nahuatl ossetiska ottomanska palau pali Pampanganska pangasinan papiamento Patwa pennsylvaniatyska persiska pfalztyska Pidginengelska piemontesiska pikardiska Pipil polska portugisiska Prusiska Pulaar Punjabi (Eastern) Qashqai quechua quenya Rapa nui Rendille Riograndenser Hunsrückisch romani ruáingga rumänska rusyn ryska rätoromanska samoanska samogitiska sango sanskrit santali saraiki sardinska saterfrisiska Schwabiska schweizertyska serbiska Setswana seychellisk kreol shanghainesiska shona Shuswap sicilianska silesiska sindarin sindhi singalesiska SiSwati skotsk gäliska skotska slovakiska slovenska slättcree somaliska South Levantine Arabic Southern Subanen Southern Zaza (Dimli) spanska sranan tongo sumeriska sundanesiska svenska swahili sydaltaiska sydhaida sydkurdiska sydsamiska sydsotho Syloti syriska Tachawit tachelhit tadzjikiska Tagal Murut tagalog Tahaggart Tamahaq tahitiska talossanska talysh tamil tarifit tatariska telugu Temuan Tetun thailändska tibetanska tigré tigrinja tjeckiska tjetjenska Tjuktjiska tjuvasjiska tok pisin Tokelauanska toki pona Tonga (Zambezi) tonganska tsonga tumbuka turkiska turkmeniska tuvaluanska tuviniska tyska Uab Meto udmurtiska uiguriska ukrainska umbundu ungerska urdu Urhobo uzbekiska vallonska venetianska veps vietnamesiska volapük võru västarmeniska västmariska västpunjabi walesiska waray wayuu wolof xhosa xiang yoruba Yukatek zazaiska zeeländska zulu östarmeniska östmariska Okänt språk - Filbeskrivning
- Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
- Fält och struktur
- Menings-id [tabb] Språk [tabb] Text
Detailed Sentences
- Filnamn
-
{{sentencesDetailed | filename}}
Alla språk Endast meningar på: abchaziska adygeiska afghanska afrihili afrikaans ainu aklan albanska algerisk arabiska amhariska Ancient Hebrew arabiska aragonesiska assamesiska asturiska avariska awadhi aymara azerbajdzjanska balinesiska baluchiska bambara banjariska basjkiriska baskiska Baybayanon bayerska belarusiska bengali berber berom bhojpuri bislama bodo bosniska bretonska Brithenig bulgariska burjatiska burmesiska cayuga cebuano Central Huasteca Nahuatl Central Kanuri Central Mnong centralbikol centraldusun centralkurdiska (sorani) chagatai chamorro chavacano cherokesiska chinook Chinyanja choctaw Coastal Kadazan Cuyonon cycL danska Divehi Drents dunganska Dutton World Speedwords egyptisk arabiska emiliska engelska erjya Erromintxela esperanto estniska evenki (språk) ewe extremaduriska feniciska Fiji-hindi fijianska finska fornarameiska fornengelska fornfranska Fornfrisiska forngrekiska fornnordiska Fornsaxiska fornspanska forntupi Fornöstslaviska franska frisiska friulianska färöiska gã gagauziska galiciska gan garhwali gegiska georgiska gilbertiska gotiska grekiska Gronings grönländska Guadeloupean Creole French guaraní Guerrero Nahuatl gujarati gulfarabiska haida haitiska hakka hausa hawaiiska hebreiska hiligaynon hindi Hitchiti Hmong Daw (White) Hmong Njua (Green) ho högsorbiska ibanska ido igbo Ilokano indonesiska ingriska Interglossa interlingua interlingue inuktitut irakisk arabiska iriska Isan isländska italienska jakutiska japanska javanesiska Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddisch jin Juhuri (Judeo-Tat) K'iche' kabardinska kabyliska kalmuckiska kamba kambodjanska kannada kantonesiska karachay-balkar Karakalpakiska Karakhanid karelska kashmiriska kasjubiska katalanska kazakiska Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut khakasiska Khalaj khasi kinesiska kinjarwanda kirgisiska Kirundi klingonska komi-permjakiska Komi-syrjänska Kongo-swahili Konkani (Goan) koreanska korniska korsikanska kotava Krimtatariska kroatiska kumykiska kvänska kölsch Láadan ladino ladinska lakota laotiska latin laziska lettgalliska lettiska Libyan Arabic liguriska limburgiska lingala lingua franca nova litauiska litterär kinesiska livoniska lojban lombardiska louisiana-kreol Luganda Lushootseed luxemburgiska lågsorbiska lågtyska (lågsaxiska) maduresiska Mahasu Pahari maithili makedonska malagassiska malajiska Malay (Vernacular) malayalam maltesiska Mambae manchuriska manx maori mapudungun marathi marockansk arabiska marockansk standard-tamazight marshalliska mauritansk kreol medelengelska medelfranska Meitei mi’kmaq Middle Persian (Pahlavi) min nan minangkabau mingrelianska mirandesiska mohawk moksja mon mongoliska Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl nande napolitanska nauruanska navaho nederländska nepalesiska newariska Ngeq Nigerian Fulfulde niueanska nogai Nordfrisiska nordkurdiska (kurmanji) nordlevantinsk arabiska nordsamiska norskt bokmål North Moluccan Malay Northern Zaza (Kirmanjki) novial nuer nuosu nynorska Nyungar Nyöstsyriska O'odham occitanska Odia (Oriya) Ojibwa okinawianska Old Turkish Orizaba Nahuatl ossetiska ottomanska palau pali Pampanganska pangasinan papiamento Patwa pennsylvaniatyska persiska pfalztyska Pidginengelska piemontesiska pikardiska Pipil polska portugisiska Prusiska Pulaar Punjabi (Eastern) Qashqai quechua quenya Rapa nui Rendille Riograndenser Hunsrückisch romani ruáingga rumänska rusyn ryska rätoromanska samoanska samogitiska sango sanskrit santali saraiki sardinska saterfrisiska Schwabiska schweizertyska serbiska Setswana seychellisk kreol shanghainesiska shona Shuswap sicilianska silesiska sindarin sindhi singalesiska SiSwati skotsk gäliska skotska slovakiska slovenska slättcree somaliska South Levantine Arabic Southern Subanen Southern Zaza (Dimli) spanska sranan tongo sumeriska sundanesiska svenska swahili sydaltaiska sydhaida sydkurdiska sydsamiska sydsotho Syloti syriska Tachawit tachelhit tadzjikiska Tagal Murut tagalog Tahaggart Tamahaq tahitiska talossanska talysh tamil tarifit tatariska telugu Temuan Tetun thailändska tibetanska tigré tigrinja tjeckiska tjetjenska Tjuktjiska tjuvasjiska tok pisin Tokelauanska toki pona Tonga (Zambezi) tonganska tsonga tumbuka turkiska turkmeniska tuvaluanska tuviniska tyska Uab Meto udmurtiska uiguriska ukrainska umbundu ungerska urdu Urhobo uzbekiska vallonska venetianska veps vietnamesiska volapük võru västarmeniska västmariska västpunjabi walesiska waray wayuu wolof xhosa xiang yoruba Yukatek zazaiska zeeländska zulu östarmeniska östmariska Okänt språk - Filbeskrivning
- Contains additional fields for each sentence (owner name, date created/modified).
- Fält och struktur
- Menings-id [tabb] Språk [tabb] Text [tabb] Användarnamn [tabb] Date added [tabb] Date last modified
Original and Translated Sentences
- Filnamn
- sentences_base.tar.bz2
- Filbeskrivning
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Fält och struktur
- Menings-id [tabb] Basfält
Meningar (CC0)
- Filnamn
-
Alla språk Endast meningar på: algerisk arabiska Ancient Hebrew arabiska belarusiska bengali berber danska engelska esperanto feniciska finska fornarameiska Fornfrisiska forngrekiska fornnordiska franska hebreiska hindi ho ido interlingua italienska japanska Jewish Babylonian Aramaic Jewish Palestinian Aramaic jiddisch kabyliska kantonesiska karelska katalanska kinesiska klingonska kvänska Láadan ladino latin liguriska litterär kinesiska marockansk standard-tamazight medelengelska nederländska norskt bokmål Nyungar polska portugisiska ryska santali spanska svenska Syloti Tachawit tjeckiska toki pona tyska ukrainska ungerska volapük walesiska Okänt språk - Filbeskrivning
- Contains all the sentences available under CC0.
- Fält och struktur
- Menings-id [tabb] Språk [tabb] Text [tabb] Date last modified
Länkar
- Filnamn
- links.tar.bz2
- Filbeskrivning
- Contains the links between the sentences. 1 [tabb] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [tabb] 1.
- Fält och struktur
- Menings-id [tabb] Översättnings-id
Taggar
- Filnamn
- tags.tar.bz2
- Filbeskrivning
- Contains the list of tags associated with each sentence. 381279 [tabb] proverb means that sentence #381279 has been assigned the "proverb" tag.
- Fält och struktur
- Menings-id [tabb] Tag name
Listor
- Filnamn
- user_lists.tar.bz2
- Filbeskrivning
- Contains the list of sentence lists.
- Fält och struktur
- List-id [tabb] Användarnamn [tabb] Date created [tabb] Date last modified [tabb] Listnamn [tabb] Redigerbar av
Meningar i listor
- Filnamn
- sentences_in_lists.tar.bz2
- Filbeskrivning
- Indicates the sentences that are contained by any lists. 13 [tabb] 381279 means that sentence #381279 is contained by the list that has an id of 13.
- Fält och struktur
- List-id [tabb] Menings-id
Japanese indices
- Filnamn
- jpn_indices.tar.bz2
- Filbeskrivning
- Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Menings-id refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
- Fält och struktur
- Menings-id [tabb] Meaning id [tabb] Text
Meningar med ljud
- Filnamn
- sentences_with_audio.tar.bz2
- Filbeskrivning
- Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Fält och struktur
- Menings-id [tabb] Audio id [tabb] Användarnamn [tabb] Licens [tabb] Attribution URL
User skill level per language
- Filnamn
- user_languages.tar.bz2
- Filbeskrivning
- Indicates the self-reported skill levels of members in individual languages.
- Fält och struktur
- Språk [tabb] Skill level [tabb] Användarnamn [tabb] Details
Användargranskade meningar
- Filnamn
- users_sentences.csv
- Filbeskrivning
- Innehåller en lista över menings-id:n som är granskade av användare. Värdet av granskningen kan vara -1 (meningen är inte ok), 0 (osäker) eller 1 (meningen är ok). Varning: denna data är fortfarande experimentell.
- Fält och struktur
- Användarnamn [tabb] Menings-id [tabb] Granskning [tabb] Date added [tabb] Date last modified
Transkriptioner
- Filnamn
-
Alla språk Endast meningar på: japanska kantonesiska kinesiska uzbekiska - Filbeskrivning
- Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
- Fält och struktur
- Menings-id [tabb] Språk [tabb] Script name [tabb] Användarnamn [tabb] Transkription