Notă
Datele pe care le găsiți aici NU vor fi utile decât dacă dezvoltați un instrument lingvistic sau dacă prelucrați date.
Dacă doriți doar propoziții pe care să le puteți utiliza pentru a învăța o limbă, consultați listele de propoziții. Vă puteți construi propriile liste sau le puteți accesa pe cele create de alții. Listele pot fi descărcate și tipărite.
Informații generale despre fișiere
Multe dintre propozițiile din limba japoneză și limba engleză provin din baza de date Tanaka Corpus, care aparține domeniului public.
Creative Commons
Aceste fișiere sunt eliberate sub licența CC BY 2.0 FR.
O parte din propozițiile noastre sunt disponibile și sub licența CC0 1.0.
Licențe care acoperă conținutul audio
Licența care acoperă un fișier audio este aleasă de colaborator și se află pe pagina unde sunt listate fișierele audio la care el sau ea a contribuit.
Întrebări?
Dacă aveți întrebări sau cereri, nu ezitați să ne contactați. În general, răspundem rapid.
Descărcări
Utilizați acest instrument pentru a genera și descărca exporturi personalizate la cerere.
Descărcați toate propozițiile în limba A care sunt traduse în limba B, împreună cu traducerile.
Propoziții
- Nume fișier
-
Toate limbile Doar propoziții în: Zazaki de nord (Kirmanjki) Abhază Adyghe Afrihili Afrikaans (Lb.burilor) Ainu (Japonia) Aklanoneză Albaneză Altaică meridională Amharică Ao Naga Araba vorbită în Irak Arabă Arabă algeriană Arabă din zona Golfului Persic Arabă egipteană Arabă levantină de nord Arabă libiană Arabă marocană Arabă sud-levantină Aragoneză Aramaică evreiască palestiniană Aramaică veche armeana occidentală Asameză Asiriană neo-aramaică Asturiană (Spania) Avară Awadhi Aymara Azeră Babiloniană-aramaică evreiască Balineză baluchi Bambara Banjareză Bască Bașkiră Bavareză Baybayanoneză Bengaleză Berberă Berom Bhojpuri Bielorusă Bikol Centrală Birmaneză Bislameză Bodo Bosniacă Bretonă Brithenig Bulgară Buryat Calmucă Cașmiră Cașubiană Catalană Cayuga Cebuană Cecenă Cehă Central Kanuri Chagatai Chamorro (Ins. Mariane) Cheniană Cherokee Chineza cantoneză Chineza literară Chineză Chineză gan Chineză hakka Chineză jin Chineză min nan Chineză shanghaineză Chineză xiang Chinyanja Choctaw Chukchi Ciuvașă Coreeană Cornică Corsicană Creolă chavacano Creolă de Louisiana Creolă de Seișele Creolă franceză de Guadalupe Creolă malaieză din Maluku de Nord Croată Cuyonon CycL (limbaj cibernetic) Daneză dargwa Dhivehi Dialectele Gronings Dialectul albanez Gheg Dialectul regiunii Koln Drents Dungană Dusun centrală Eastern Armenian Ebraică Ebraică antică Emiliană Engleză Engleză medievală Engleză veche Erromintxeleză Erzya Esperanto Estoniană Evenki Ewe Extramaduriană Feniciană Feroeză Fiji Hindi Fijiană Finlandeză Finlandeză Kven Franceză Franceză medievală Franceză veche Frisiană de Saterland Friulană Friziană de nord Frizonă Frizonă veche Fulfulde nigeriană Ga Galeză Galeză scoțiană Galiciană (Spania) Ganda Garhwali Găgăuză Georgiană Germana din Pennsylvania Germană Germană de jos (Saxona de jos) Germană elvețiană Germană Hunsrik Germană palatină Gilbertină Gotică Greacă Greacă veche Groenlandeză Guarani Gujarati Gun Haida nordică Haida sudică Haitiană Hausa Hawaiiană Hiligaynon Hindi Hitchiti Hmong Daw (Albă) Hmong Njua (Verde) Ho Iban Idiș Ido (lb. artificială) Igbo Ilocano Indoneziană Ingrianeză Interglossa Interlingua Interlingua (lb. artificială) Interslavic Inuktitut Irlandeză Isaneză Islandeză Italiană Japoneză jargon chinook Javaneză Juhuri (Evreo-Tat) kabardian Kabyle Kadazan de coastă Kamba Kaningau Murut Kannada Kapampanganeză Karaceai-balkar Karakalpak Karakhanid Kareliană Kazahă Kârgâză Kechi Kelantan-Pattani Malay Khakasiană Khalaj Khasi Khmeră Kiche Kinyarwanda Kirundi Klingoniană (lb. artificială) Komi-permiak Komi-Zyrianeză Konkani (Goaneză) Kotava Kumyk Kurdă centrală (Soranî) Kurdă nordică (Kurmancî) Kurdă sudică Ladaneză Ladină Ladino Lakota Laoțiană Latgaliană Latină Lază Letonă Lezgi Ligură Limba abazină Limba castiliană veche Limba prusacă veche Limba sileziană Limba siloteză Limba tokelauană Limbajul stenografic Dutton Limburgheză Lingala Lingua franca nova Lituaniană Livoniană Lojban (lb. artificială) Lombardă Lushootseed Luxemburgheză Macedoneană Madureză Maghiară Mahasu Pahari Maithili Malaeză Malaieză (Vernaculară) Malayalam (India) Malgașă Malteză Mambae Manciuriană Mandar Manx Maori mapuche Marathi Mari de câmpie Mari de deal Marșaleză Meitei Micmac Minangkabau Mingreliană Mirandeză Mnong centrală Mohawk Moksha Mon Mongolă Mono (USA) Morisyen Muscogee (Creek) Naga (Tangshang) Nahuatl Nahuatl de Guerrero Nahuatl de Huasteca Centrală Nahuatl de Orizaba Nande napolitană Nauruană Navajo Nepaleză Nevari Ngeq Niueană Nogai Nordică veche Norvegiană bokmål Norvegiană nynorsk Novialeză nuer Nuosu Nyungar O'odham Occitană Odia (Oriya) Ojibwe Okinawaneză Olandeză Oseţiană (Caucaz) Palauană pali Pangasinan Papiamento Paștună Patois jamaican Persană Persană mijlocie (Pahlavi) Picardă Pidgin chinez-englez Piedmonteză Pipileză Plains Cree Poloneză Portugheză Pulaar Punjabă de Est Punjabă de Vest Qashqai Quechua (Anzii Cordilieri) Rapa nui Rendille Retoromană (Elveţia) rohingya Română Rromani Rusă Rusină Sami de nord Sami de Sud Samoană Samogitianeză Sango Sanscrită santali Saraiki Sardiniană Saxonă veche Sârbă Scots Sesotho Setswana Shuswap Siciliană Sindarină Sindhi Singhaleză Siriacă Slavă veche (Est) Slovacă Slovenă Somaleză Sorabă de jos Sorabă de sus Spaniolă sranan tongo Subanen sudică Suedeză Sumeriană Sundaneză Svan Svazi Swahili swahili (R.D. Congo) Șona Șvabă Tachavit Tadjică Tagal Murut Tagalogă/Filipineză Tahagart Tamahac Tahitiană Talossaneză Talysh tamazight standard marocană Tamilă Tarifit Tashelhit Tavaluaneză Tătară Tătară crimeeană Telugu Temuan Tetun Thailandeză Tibetană Tigreniană Tigrină Tok pisin Toki Pona (limbă artificială) Tongană Tonganeză (Zambezi) Tsonga tumbuka Tupinambá Turcă Turcă otomană Turcă veche Turkmenă Tuvană Uab Meto Ucraineană Udmurtă Uigură Umbundu Urdu Urhobo Uzbecă Valonă Venetă Veps Vietnameză Volapük (lb. artificială) Võro Waray Wayuu West-Central Oromo Wolof Xhosa Yakută Yoruba Yucatec Zaza Zazaki de sud (Dimli) Zeelandică Zulu Limbă necunoscută - Descriere fișier
- Conține toate propozițiile în limba selectată. Fiecărei propoziții îi este asociată un id unic și un cod de limbă ISO 639-3.
- Câmpuri și structură
- ID propoziție [filă] Limbă [filă] Text
Propoziții detaliate
- Nume fișier
-
{{sentencesDetailed | filename}}
Toate limbile Doar propoziții în: Zazaki de nord (Kirmanjki) Abhază Adyghe Afrihili Afrikaans (Lb.burilor) Ainu (Japonia) Aklanoneză Albaneză Altaică meridională Amharică Ao Naga Araba vorbită în Irak Arabă Arabă algeriană Arabă din zona Golfului Persic Arabă egipteană Arabă levantină de nord Arabă libiană Arabă marocană Arabă sud-levantină Aragoneză Aramaică evreiască palestiniană Aramaică veche armeana occidentală Asameză Asiriană neo-aramaică Asturiană (Spania) Avară Awadhi Aymara Azeră Babiloniană-aramaică evreiască Balineză baluchi Bambara Banjareză Bască Bașkiră Bavareză Baybayanoneză Bengaleză Berberă Berom Bhojpuri Bielorusă Bikol Centrală Birmaneză Bislameză Bodo Bosniacă Bretonă Brithenig Bulgară Buryat Calmucă Cașmiră Cașubiană Catalană Cayuga Cebuană Cecenă Cehă Central Kanuri Chagatai Chamorro (Ins. Mariane) Cheniană Cherokee Chineza cantoneză Chineza literară Chineză Chineză gan Chineză hakka Chineză jin Chineză min nan Chineză shanghaineză Chineză xiang Chinyanja Choctaw Chukchi Ciuvașă Coreeană Cornică Corsicană Creolă chavacano Creolă de Louisiana Creolă de Seișele Creolă franceză de Guadalupe Creolă malaieză din Maluku de Nord Croată Cuyonon CycL (limbaj cibernetic) Daneză dargwa Dhivehi Dialectele Gronings Dialectul albanez Gheg Dialectul regiunii Koln Drents Dungană Dusun centrală Eastern Armenian Ebraică Ebraică antică Emiliană Engleză Engleză medievală Engleză veche Erromintxeleză Erzya Esperanto Estoniană Evenki Ewe Extramaduriană Feniciană Feroeză Fiji Hindi Fijiană Finlandeză Finlandeză Kven Franceză Franceză medievală Franceză veche Frisiană de Saterland Friulană Friziană de nord Frizonă Frizonă veche Fulfulde nigeriană Ga Galeză Galeză scoțiană Galiciană (Spania) Ganda Garhwali Găgăuză Georgiană Germana din Pennsylvania Germană Germană de jos (Saxona de jos) Germană elvețiană Germană Hunsrik Germană palatină Gilbertină Gotică Greacă Greacă veche Groenlandeză Guarani Gujarati Gun Haida nordică Haida sudică Haitiană Hausa Hawaiiană Hiligaynon Hindi Hitchiti Hmong Daw (Albă) Hmong Njua (Verde) Ho Iban Idiș Ido (lb. artificială) Igbo Ilocano Indoneziană Ingrianeză Interglossa Interlingua Interlingua (lb. artificială) Interslavic Inuktitut Irlandeză Isaneză Islandeză Italiană Japoneză jargon chinook Javaneză Juhuri (Evreo-Tat) kabardian Kabyle Kadazan de coastă Kamba Kaningau Murut Kannada Kapampanganeză Karaceai-balkar Karakalpak Karakhanid Kareliană Kazahă Kârgâză Kechi Kelantan-Pattani Malay Khakasiană Khalaj Khasi Khmeră Kiche Kinyarwanda Kirundi Klingoniană (lb. artificială) Komi-permiak Komi-Zyrianeză Konkani (Goaneză) Kotava Kumyk Kurdă centrală (Soranî) Kurdă nordică (Kurmancî) Kurdă sudică Ladaneză Ladină Ladino Lakota Laoțiană Latgaliană Latină Lază Letonă Lezgi Ligură Limba abazină Limba castiliană veche Limba prusacă veche Limba sileziană Limba siloteză Limba tokelauană Limbajul stenografic Dutton Limburgheză Lingala Lingua franca nova Lituaniană Livoniană Lojban (lb. artificială) Lombardă Lushootseed Luxemburgheză Macedoneană Madureză Maghiară Mahasu Pahari Maithili Malaeză Malaieză (Vernaculară) Malayalam (India) Malgașă Malteză Mambae Manciuriană Mandar Manx Maori mapuche Marathi Mari de câmpie Mari de deal Marșaleză Meitei Micmac Minangkabau Mingreliană Mirandeză Mnong centrală Mohawk Moksha Mon Mongolă Mono (USA) Morisyen Muscogee (Creek) Naga (Tangshang) Nahuatl Nahuatl de Guerrero Nahuatl de Huasteca Centrală Nahuatl de Orizaba Nande napolitană Nauruană Navajo Nepaleză Nevari Ngeq Niueană Nogai Nordică veche Norvegiană bokmål Norvegiană nynorsk Novialeză nuer Nuosu Nyungar O'odham Occitană Odia (Oriya) Ojibwe Okinawaneză Olandeză Oseţiană (Caucaz) Palauană pali Pangasinan Papiamento Paștună Patois jamaican Persană Persană mijlocie (Pahlavi) Picardă Pidgin chinez-englez Piedmonteză Pipileză Plains Cree Poloneză Portugheză Pulaar Punjabă de Est Punjabă de Vest Qashqai Quechua (Anzii Cordilieri) Rapa nui Rendille Retoromană (Elveţia) rohingya Română Rromani Rusă Rusină Sami de nord Sami de Sud Samoană Samogitianeză Sango Sanscrită santali Saraiki Sardiniană Saxonă veche Sârbă Scots Sesotho Setswana Shuswap Siciliană Sindarină Sindhi Singhaleză Siriacă Slavă veche (Est) Slovacă Slovenă Somaleză Sorabă de jos Sorabă de sus Spaniolă sranan tongo Subanen sudică Suedeză Sumeriană Sundaneză Svan Svazi Swahili swahili (R.D. Congo) Șona Șvabă Tachavit Tadjică Tagal Murut Tagalogă/Filipineză Tahagart Tamahac Tahitiană Talossaneză Talysh tamazight standard marocană Tamilă Tarifit Tashelhit Tavaluaneză Tătară Tătară crimeeană Telugu Temuan Tetun Thailandeză Tibetană Tigreniană Tigrină Tok pisin Toki Pona (limbă artificială) Tongană Tonganeză (Zambezi) Tsonga tumbuka Tupinambá Turcă Turcă otomană Turcă veche Turkmenă Tuvană Uab Meto Ucraineană Udmurtă Uigură Umbundu Urdu Urhobo Uzbecă Valonă Venetă Veps Vietnameză Volapük (lb. artificială) Võro Waray Wayuu West-Central Oromo Wolof Xhosa Yakută Yoruba Yucatec Zaza Zazaki de sud (Dimli) Zeelandică Zulu Limbă necunoscută - Descriere fișier
- Conține câmpuri suplimentare pentru fiecare propoziție (numele proprietarului, data creării/modificării).
- Câmpuri și structură
- ID propoziție [filă] Limbă [filă] Text [filă] Nume de utilizator [filă] Data adăugării [filă] Data ultimei modificări
Propoziții originale și traduse
- Nume fișier
- sentences_base.tar.bz2
- Descriere fișier
-
Fiecare propoziție este listată ca originală sau ca traducere a alteia. Câmpul „bază” poate avea următoarele valori:
- zero: propoziția este originală, nu o traducere a alteia.
- mai mare decât zero: id-ul propoziției din care a fost tradusă.
- \ N: Necunoscut (rar).
- Câmpuri și structură
- ID propoziție [filă] Câmp de bază
Propoziții (CC0)
- Nume fișier
-
Toate limbile Doar propoziții în: Arabă Arabă algeriană Aramaică evreiască palestiniană Aramaică veche Babiloniană-aramaică evreiască Bengaleză Berberă Bielorusă Catalană Cehă Chineza cantoneză Chineza literară Chineză Daneză Ebraică Ebraică antică Engleză Engleză medievală Esperanto Feniciană Finlandeză Finlandeză Kven Franceză Frizonă veche Galeză Germană Greacă veche Hindi Ho Idiș Ido (lb. artificială) Interlingua Interlingua (lb. artificială) Italiană Japoneză Kabyle Kareliană Klingoniană (lb. artificială) Konkani (Goaneză) Ladaneză Ladino Latină Ligură Limba siloteză Maghiară Nordică veche Norvegiană bokmål Nyungar Odia (Oriya) Olandeză Poloneză Portugheză Rusă santali Spaniolă Suedeză Tachavit tamazight standard marocană Toki Pona (limbă artificială) Ucraineană Volapük (lb. artificială) Limbă necunoscută - Descriere fișier
- Conține toate propozițiile disponibile sub licența CC0.
- Câmpuri și structură
- ID propoziție [filă] Limbă [filă] Text [filă] Data ultimei modificări
Linkuri
- Nume fișier
- links.tar.bz2
- Descriere fișier
- Conține linkurile dintre propoziții. 1 [filă] 77 înseamnă că propoziția #77 este traducerea propoziției #1. De asemenea, este prezent și linkul reciproc, deci fișierul va conține și un rând care spune 77 [filă] 1.
- Câmpuri și structură
- ID propoziție [filă] ID traducere
Etichete
- Nume fișier
- tags.tar.bz2
- Descriere fișier
- Conține lista de etichete aferente fiecărei propoziții. 381279 [filă] proverb înseamnă că propoziției #381279 i s-a atribuit eticheta „proverb”.
- Câmpuri și structură
- ID propoziție [filă] Nume etichetă
Liste
- Nume fișier
- user_lists.tar.bz2
- Descriere fișier
- Conține lista cu listele de propoziții.
- Câmpuri și structură
- ID listă [filă] Nume de utilizator [filă] Data creării [filă] Data ultimei modificări [filă] Numele listei [filă] Editabilă de
Propoziții din liste
- Nume fișier
- sentences_in_lists.tar.bz2
- Descriere fișier
- Indică propozițiile din liste. 13 [filă] 381279 înseamnă că propoziția #381279 face parte din lista care are id-ul 13.
- Câmpuri și structură
- ID listă [filă] ID propoziție
Indici japonezi
- Nume fișier
- jpn_indices.tar.bz2
- Descriere fișier
- Conține echivalentul „liniilor B” din fișierul Tanaka Corpus distribuit de Jim Breen. Consultați această pagină pentru format. Fiecare intrare este asociată cu o pereche de propoziții în japoneză/engleză. ID propoziție se referă la id-ul propoziției în limba japoneză. ID se referă la id-ul propoziției în limba engleză.
- Câmpuri și structură
- ID propoziție [filă] ID [filă] Text
Propoziții cu conținut audio
- Nume fișier
- sentences_with_audio.tar.bz2
- Descriere fișier
- Conține id-urile propozițiilor în toate limbile pentru care este disponibil conținutul audio. Alte câmpuri indică cine a înregistrat conținutul audio, licența sa și o adresă URL de atribuire a autorului. Dacă câmpul de licență este gol, este posibil să nu puteți utiliza conținutul audio în afara proiectului Tatoeba.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Câmpuri și structură
- ID propoziție [filă] Audio id [filă] Nume de utilizator [filă] Licență [filă] Atribuire URL
Nivelul de cunoștință al utilizatorului pentru fiecare limbă
- Nume fișier
- user_languages.tar.bz2
- Descriere fișier
- Indică nivelurile de cunoștințe ale membrilor asupra limbilor străine, așa cum au fost declarate de către aceștia.
- Câmpuri și structură
- Limbă [filă] Nivel de cunoștință [filă] Nume de utilizator [filă] Detalii
Revizuiri ale propozițiilor utilizatorilor
- Nume fișier
- users_sentences.csv
- Descriere fișier
- Conține propoziții revizuite de utilizatori. Evaluarea poate fi notată cu -1 (propoziția nu este OK), 0 (discutabil sau incert) sau 1 (propoziția este OK). Atenție: aceste date sunt încă experimentale.
- Câmpuri și structură
- Nume de utilizator [filă] ID propoziție [filă] Revizuire [filă] Data adăugării [filă] Data ultimei modificări
Transcrieri
- Nume fișier
-
Toate limbile Doar propoziții în: Chineza cantoneză Chineză Japoneză Uzbecă - Descriere fișier
- Conține toate transcrierile din scripturile auxiliare sau alternative. Un nume de utilizator asociat unei transcrieri indică utilizatorul care a revizuit-o și modificat-o ultima dată. O transcriere fără nume de utilizator nu este marcată ca revizuită. Denumirea scriptului este definită în conformitate cu standardul ISO 15924.
- Câmpuri și structură
- ID propoziție [filă] Limbă [filă] Denumire script [filă] Nume de utilizator [filă] Transcriere