Nota
Le datos que se trova hic SOLMENTE te essera utile si tu face programmas linguistic o de processamento de datos.
Si tu vole phrases a usar pro apprender un lingua, consulta le listas de phrases. Tu pote construer le tues o vider illos create per alteres. Le listas pote esser discargate e imprimite.
Information general sur le files
Multe phrases in japonese e anglese proveni del corpus Tanaka, que pertine al dominio public.
Creative Commons
Iste files es liberate sub CC BY 2.0 FR.

Un portion de nostre phrases es etiam disponibile sub CC0 1.0.

Licentias que coperi audio
Le licentia que coperi un file audio es seligite per le contributor e es indicate sur le pagina que lista le flies audio que ille o illa ha contribuite.
Questiones?
Si tu ha questiones o requestas, non hesita de contactar nos. In general, nos responde rapidemente.
Discargamentos
Usa iste instrumento pro generar e discargar exportationes personalisate sur demanda.
Discargar tote le phrases in lingua A que es traducite in lingua B, con lor traductiones.
Phrases
- Nomine del file
-
Tote le linguas Solmente phrases in: Abaza abkhaz adygeano afrihili afrikaans ainu aklanon albanese albanian gheg altai del sud alte sorabo amharico Ancient Hebrew anglese anglese antique anglese medie Ao Naga arabe arabe algerian arabe del Golfo arabe egyptie arabe irakian arabe levante del nord arabe levante del sud arabe moroccan aragonese aramaico ancian aramaico babylonian judee aramaico palestin judee assamese asturiano Avar awadhi aymara azerbaidzhano balinese Baluchi bambara banjar basco bashkir basse germano (basse saxone) basse sorabo bavarian baybayanon bengali berber Berom bhojpuri bielorusso bikol central birmano bislama bodo bosniaco breton brithenig bulgaro buryat cabardiano calmuco cantonese careliano catalano cayuga cebuano Central Kanuri Central Kurdish (Soranî) chagatai chamorro chavacan checheno cherokee chinese gan chinese hakka chinese jin chinese litterari chinese mandarin chinese min nan chinese xiang Chinook Jargon chinyanja choctaw chukchi chuvash cingalese coloniese coreano cornico corso cree del planas creolo francese guadeloupean creolo haitian creolo louisianese creolo mauritian creolo seychellese croato cuyonon CycL danese drenthese dungan dusun central Eastern Armenian emilian erromintxela erzya espaniol espaniol ancian esperanto estoniano evenki ewe extremaduran faroese fijiano finnese finnese kven francese francese ancian francese medie frison frison del nord frison saterlandese friulano fulfulde nigerian ga gaelico scotese gagauz galleco gallese garhwali georgiano germano germano palatine germano pennsylvanian germano suisse gilbertese gothic greco groenlandic gronings guarani gujarati Gun haida haida del sud hausa hawaiano hebreo hiligaynon hindi hindi fiji Hitchiti hmong daw (blanc) hmong njua (verde) ho hungaro hunsrik iban ido igbo ilocano indonesiano ingrian Interglossa interlingua interlingue Interslavic inuktitut irlandese isan islandese italiano japonese javanese juhuri (judeo-tat) k'iche' kabylo kadazan costari kamba kannada kapampangan karachay-balkaro karakalpak Karakhanid kashmiri kashubian kazakh kekchi (q'eqchi') Kelantan-Pattani Malay keningau murut khakas Khalaj khasi khmer kinyarwanda kirghizo kirundi klingon komi-permyak komi-zyrian konkani (goan) kotava kumyko laadan ladin ladino lakota laotiano latgalian latino laz Lezgi Libyan Arabic ligurian limburgese lingala lingua franca nova lingua grec ancian lingua lette lingua maya yucatec Lingua meitei lingua nauruan Lingua silesian lithuano livonian lojban lombard luganda Lushootseed luxemburgese macedone madurese Mahasu Pahari maithili malay malay (vulgar) malay moluccan del nord malayalam maldivian malgache maltese mambae manchu Mandar mannese maori mapuche marathi mari collinic mari pratic marshallese micmac Middle Persian (Pahlavi) minangkabau mingrelian mirandese mnong central mohawk moksha mon mongol Mono (USA) Muskogee (Creek) naga (tangshang) nahuatl nahuatl guerrero nahuatl huasteca central nahuatl orizaba Nande napolitano navajo nederlandese neo-aramaico assyrie nepalese newari ngeq nieuano nogai nord-germanico ancian Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvegiano bokmål norvegiano nynorsk novial nuer nuosu nyungar O'odham occitano odia (oriya) ojibwe okinawan Old Frisian osseto palauano pali pangasinan papiamento pashto patois jamaican pedemontese persiano phenicio picard pidgin anglese chinese pipil polonese portugese prussian ancian pulaar punjabi (occidental) punjabi (oriental) Qashqai quechua quenya rapa nui rendille rohingya romanche romani romaniano russo rusyn sami del nord sami del sud samoano samogitian sango sanskrit santali Saraiki sardo saxone ancian scotese serbo setswana shanghaiese shona shuswap siciliano sindarin sindhi slavic oriental vetule slovaco sloveno somali sotho del sud Southern Kurdish Southern Subanen Southern Zaza (Dimli) speedwords sranan tongo sumerian sundanese Svan svedese swabian swahili swahili del Congo swati Sylheti syriaco tachawit tagal murut tagalog tahaggart tamahaq tahitiano tajiko talossan talysh tamazight marocchin standard tamil tarifit Tashelhit tatar tatar crimean tcheco telugu temuan tetun thai tibetano tigre tigrinya tok pisin tokelauan toki pona tonga (zambezi) tongano tsonga tumbuka Tupinambá turco turco ancian turco ottoman turkmeno tuvaluan tuvano uab meto udmurto ukrainiano umbundu urdu urhobo uyghur uzbeko venetian veps vietnamese volapük võro wallon waray Wayuu West-Central Oromo Western Armenian wolof xhosa yakut yiddish yoruba zaza Zeelandic zulu Lingua incognite - Description del file
- Contine tote le phrases in le lingua seligite. Cata phase es associate con un ID unic e con un codice de lingua ISO 639-3.
- Campos e structura
- ID del phrase [scheda] Lingua [scheda] Texto
Phrases detaliate
- Nomine del file
-
{{sentencesDetailed | filename}}
Tote le linguas Solmente phrases in: Abaza abkhaz adygeano afrihili afrikaans ainu aklanon albanese albanian gheg altai del sud alte sorabo amharico Ancient Hebrew anglese anglese antique anglese medie Ao Naga arabe arabe algerian arabe del Golfo arabe egyptie arabe irakian arabe levante del nord arabe levante del sud arabe moroccan aragonese aramaico ancian aramaico babylonian judee aramaico palestin judee assamese asturiano Avar awadhi aymara azerbaidzhano balinese Baluchi bambara banjar basco bashkir basse germano (basse saxone) basse sorabo bavarian baybayanon bengali berber Berom bhojpuri bielorusso bikol central birmano bislama bodo bosniaco breton brithenig bulgaro buryat cabardiano calmuco cantonese careliano catalano cayuga cebuano Central Kanuri Central Kurdish (Soranî) chagatai chamorro chavacan checheno cherokee chinese gan chinese hakka chinese jin chinese litterari chinese mandarin chinese min nan chinese xiang Chinook Jargon chinyanja choctaw chukchi chuvash cingalese coloniese coreano cornico corso cree del planas creolo francese guadeloupean creolo haitian creolo louisianese creolo mauritian creolo seychellese croato cuyonon CycL danese drenthese dungan dusun central Eastern Armenian emilian erromintxela erzya espaniol espaniol ancian esperanto estoniano evenki ewe extremaduran faroese fijiano finnese finnese kven francese francese ancian francese medie frison frison del nord frison saterlandese friulano fulfulde nigerian ga gaelico scotese gagauz galleco gallese garhwali georgiano germano germano palatine germano pennsylvanian germano suisse gilbertese gothic greco groenlandic gronings guarani gujarati Gun haida haida del sud hausa hawaiano hebreo hiligaynon hindi hindi fiji Hitchiti hmong daw (blanc) hmong njua (verde) ho hungaro hunsrik iban ido igbo ilocano indonesiano ingrian Interglossa interlingua interlingue Interslavic inuktitut irlandese isan islandese italiano japonese javanese juhuri (judeo-tat) k'iche' kabylo kadazan costari kamba kannada kapampangan karachay-balkaro karakalpak Karakhanid kashmiri kashubian kazakh kekchi (q'eqchi') Kelantan-Pattani Malay keningau murut khakas Khalaj khasi khmer kinyarwanda kirghizo kirundi klingon komi-permyak komi-zyrian konkani (goan) kotava kumyko laadan ladin ladino lakota laotiano latgalian latino laz Lezgi Libyan Arabic ligurian limburgese lingala lingua franca nova lingua grec ancian lingua lette lingua maya yucatec Lingua meitei lingua nauruan Lingua silesian lithuano livonian lojban lombard luganda Lushootseed luxemburgese macedone madurese Mahasu Pahari maithili malay malay (vulgar) malay moluccan del nord malayalam maldivian malgache maltese mambae manchu Mandar mannese maori mapuche marathi mari collinic mari pratic marshallese micmac Middle Persian (Pahlavi) minangkabau mingrelian mirandese mnong central mohawk moksha mon mongol Mono (USA) Muskogee (Creek) naga (tangshang) nahuatl nahuatl guerrero nahuatl huasteca central nahuatl orizaba Nande napolitano navajo nederlandese neo-aramaico assyrie nepalese newari ngeq nieuano nogai nord-germanico ancian Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) norvegiano bokmål norvegiano nynorsk novial nuer nuosu nyungar O'odham occitano odia (oriya) ojibwe okinawan Old Frisian osseto palauano pali pangasinan papiamento pashto patois jamaican pedemontese persiano phenicio picard pidgin anglese chinese pipil polonese portugese prussian ancian pulaar punjabi (occidental) punjabi (oriental) Qashqai quechua quenya rapa nui rendille rohingya romanche romani romaniano russo rusyn sami del nord sami del sud samoano samogitian sango sanskrit santali Saraiki sardo saxone ancian scotese serbo setswana shanghaiese shona shuswap siciliano sindarin sindhi slavic oriental vetule slovaco sloveno somali sotho del sud Southern Kurdish Southern Subanen Southern Zaza (Dimli) speedwords sranan tongo sumerian sundanese Svan svedese swabian swahili swahili del Congo swati Sylheti syriaco tachawit tagal murut tagalog tahaggart tamahaq tahitiano tajiko talossan talysh tamazight marocchin standard tamil tarifit Tashelhit tatar tatar crimean tcheco telugu temuan tetun thai tibetano tigre tigrinya tok pisin tokelauan toki pona tonga (zambezi) tongano tsonga tumbuka Tupinambá turco turco ancian turco ottoman turkmeno tuvaluan tuvano uab meto udmurto ukrainiano umbundu urdu urhobo uyghur uzbeko venetian veps vietnamese volapük võro wallon waray Wayuu West-Central Oromo Western Armenian wolof xhosa yakut yiddish yoruba zaza Zeelandic zulu Lingua incognite - Description del file
- Contine campos additional pro cata phrase (nomine del proprietario, data de creation/modification).
- Campos e structura
- ID del phrase [scheda] Lingua [scheda] Texto [scheda] Nomine de usator [scheda] Data de addition [scheda] Data de ultime modification
Phrases original e traducite
- Nomine del file
- sentences_base.tar.bz2
- Description del file
-
Cata phrase es listate como original o como traduction de un altere. Le campo “base” pote haber le sequente valores:
- zero: Le phrase es original, non un traduction de un altere.
- superior a zero: Le ID del phrase desde le qual illo ha essite traducite.
- \N: Incognite (rar).
- Campos e structura
- ID del phrase [scheda] Campo de base
Phrases (CC0)
- Nomine del file
-
Tote le linguas Solmente phrases in: Ancient Hebrew anglese anglese medie arabe arabe algerian aramaico ancian aramaico babylonian judee aramaico palestin judee bengali berber bielorusso cantonese careliano catalano chinese litterari chinese mandarin danese espaniol esperanto finnese finnese kven francese gallese germano hebreo hindi ho hungaro ido interlingua interlingue italiano japonese kabylo klingon konkani (goan) laadan ladino latino ligurian lingua grec ancian nederlandese nord-germanico ancian norvegiano bokmål nyungar odia (oriya) Old Frisian phenicio polonese portugese russo santali svedese Sylheti tachawit tamazight marocchin standard tcheco toki pona ukrainiano volapük yiddish Lingua incognite - Description del file
- Contine tote le phrases disponibile sub CC0.
- Campos e structura
- ID del phrase [scheda] Lingua [scheda] Texto [scheda] Data de ultime modification
Ligamines
- Nomine del file
- links.tar.bz2
- Description del file
- Contine le ligamines inter phrases. 1 [scheda] 77 significa que le phrase № 77 es le traduction del phrase № 1. Le ligamine reciproc es etiam presente, e le file etiam contine un linea con le texto 77 [scheda] 1.
- Campos e structura
- ID del phrase [scheda] ID de traduction
Etiquettas
- Nomine del file
- tags.tar.bz2
- Description del file
- Contine le lista de etiquettas associate a cata phrase. 381279 [scheda] proverb significa que le phrase № 381279 ha recipite le etiquetta "proverb".
- Campos e structura
- ID del phrase [scheda] Nomine de etiquetta
Listas
- Nomine del file
- user_lists.tar.bz2
- Description del file
- Contine le lista de listas de phrase.
- Campos e structura
- ID de lista [scheda] Nomine de usator [scheda] Data de creation [scheda] Data de ultime modification [scheda] Nomine de lista [scheda] Modificabile per
Phrases in listas
- Nomine del file
- sentences_in_lists.tar.bz2
- Description del file
- Indica le phrases que face parte de qualcunque listas. 13 [scheda] 381279 significa que le phrase № 381279 figura in le lista con ID 13.
- Campos e structura
- ID de lista [scheda] ID del phrase
Indices japonese
- Nomine del file
- jpn_indices.tar.bz2
- Description del file
- Contine le equivalente del "lineas B" in le file Tanaka Corpus distribuite per Jim Breen. Vide le description del formato. Cata entrata es associate a un par de phrases japonese/anglese. ID del phrase refere al ID del phrase japonese. ID de signification refere al ID del phrase anglese.
- Campos e structura
- ID del phrase [scheda] ID de signification [scheda] Texto
Phrases con audio
- Nomine del file
- sentences_with_audio.tar.bz2
- Description del file
- Contine le IDs del phrases in tote le linguas pro le quales audio es disponibile. Altere campos indica qui ha registrate le audio, su licentia e un URL pro recognoscer le autor. Si le campo de licentia es vacue, tu non pote reusar le audio foras del projecto Tatoeba.
- Discargar audio
- Un phrase singule pote haber un o plus registrationes audio, cata un de un altere voce. Pro discargar un registration audio particular, usa su ID de audio pro determinar le adresse URL de discargamento. Per exemplo, pro discargar le registration audio con le ID 1234, le adresse URL es https://tatoeba.org/audio/download/1234.
- Campos e structura
- ID del phrase [scheda] ID de audio [scheda] Nomine de usator [scheda] Licentia [scheda] URL pro attribution
Nivello de habilitate de usatores per lingua
- Nomine del file
- user_languages.tar.bz2
- Description del file
- Enumera le nivellos de habilitate que le membros indica pro cata lingua.
- Campos e structura
- Lingua [scheda] Nivello de habilitate [scheda] Nomine de usator [scheda] Detalios
Evalutationes de phrases per usatores
- Nomine del file
- users_sentences.csv
- Description del file
- Continue le phrases evalutate per usatores. Le valoro del evalutation pote esser -1 (phrase non OK), 0 (indecise o insecur), o 1 (phrase OK). Attention: iste datos es ancora experimental.
- Campos e structura
- Nomine de usator [scheda] ID del phrase [scheda] Evalutation [scheda] Data de addition [scheda] Data de ultime modification
Transcriptiones
- Nomine del file
-
Tote le linguas Solmente phrases in: cantonese chinese mandarin japonese uzbeko - Description del file
- Contine tote le transcriptiones in scripturas auxiliar o alternative. Un nomine de usator associate con un transcription indica le usator que lo revideva le ultime vice e possibilemente lo modificava. Un transcription sin nomine de usator non ha essite marcate como revidite. Le nomine del scriptura es definite secundo le standard ISO 15924.
- Campos e structura
- ID del phrase [scheda] Lingua [scheda] Nomine del scriptura [scheda] Nomine de usator [scheda] Transcription