Oharra
Hemen topatuko dituzun datuak EZ dira erabilgarriak izango ez bazaude hizkuntza tresna baten kodea idazten edo honelako datuak prozesatzen.
Esaldiak hizkuntza ikasteko besterik behar ez badituzu, aztertu esaldien zerrendak. Zuk zeuk zeure zerrenda sortu ahal duzu, edo ikus dezakezu beste erabiltzaileek sortutako zerrendak. Zerrenda horiek deskargatu eta inprima daitezke.
Fitxategiei buruzko informazio orokorra
Japonierazko eta ingelesezko hainbat esaldi Tanaka Corpus horretatik datoz. PD lizentzia dute.
Creative commons
Fitxategi hauek CC BY 2.0 FR lizentziarekin eman dira argitara.
Gure esaldi batzuk CC0 1.0. lizentziarekin eskuragarri daude.
Lizentziek audioei ere estaldura ematen diete
Audioa babesten duen lizentzia hau ekarpena egin duenak hautatu du. Audio fitxategien zerrendak dituen orrialdean zehazten da nork egin duen ekarpena.
Galderarik?
Galdera edo eskaerarik egin nahi badiguzu contact us. Gehienetan azkar erantzuten dugu.
Deskargak
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Esaldiak
- Fitxategiaren izena
-
Hizkuntza guztiak Bakarrik esaldiak hemen: Jamaikako kreolera abkhazera adygheera afrihili afrikaansa aimara ainuera (Japoniako iparraldeko hizkuntza) aklanera albaniera alemana Aljeriako arabiera amazigera amazigera estandarra Amharera Ancient Hebrew anglo-saxoiera antzinako eskandinaviera Antzinako frantsesa antzinako gaztelania antzinako saxoiera Antzintako greziera arabiera aragoiera aramera zaharra Asiriera assamera asturiera avarera Awadhi azerbaijanera baliera Balutxi bambarera banjarera bavariera baxkirera baybay hizkuntza behe sorabiera (Dolnoserbski) behe-aleman (behe-saxoiera) bengalera Berom bhojpuri bieloerrusiera birmaniera Bislama bodoera bosniera bretoiera (brezhoneg) Brithenig bulgariera buryatera cayugera cebuera Central Kanuri Central Kurdish (Soranî) chamorro chavacano Chinook Jargon choctaw chuvashera coastal kadazan cuyononera CycL daniera Drents dunganera Eastern Armenian Egiptoko arabiera ekialdeko eslaviera zaharra Ekialdeko frisiera ekialdeko mari emiliar dialektoa Erdi Aroko frantsesa Erdi Aroko ingelesa erdialdeko bikolera erdialdeko dusunera erdialdeko Huastecako nahuatla erdialdeko mnong erretorromaniera erromaniera Erromintxela errumaniera errusiera erziera Eskoziako gaelikoa eslovakiera esloveniera esperantoa estoniera euskara Evenkera ewera (Niger-Kongo) extremadurera faroera feniziera fiji hindi fijiera finlandiera / suomiera frantsesa frisiera friulianera ga gaelikoa (Eskoziakoa) gagauzera galesera galiziera gan txinera garhwaliera gaztelania geg albaniera georgiera goi-sorabiera (hornjoserbšćina) Golkoko arabiera gotikoa greziera groenlandiera gronings Guadalupe uharteko frantses kreolera guaraniera Guerreroko nahuatlera gujaratiera haidera Haitiko kreolera hakka txinera hausa hawaiera hebreera hegoaldeko altaiera hegoaldeko haidera hegoaldeko min txinera hegoaldeko samiera hegoaldeko sothoera Hegoaldeko subanonera Hiligainonera hindia Hitchiti hmong njua/mong leng (miao berdea) hoera hungariera hunsrik ibanera idoa igboera ilocanoera indonesiera ingelesa ingriera, izhoriera Interglossa interlingua Interlingua inuitera Ipar Moluketako malayera ipar-ekialdeko arabiera Iparraldeko frisiera iparraldeko samiera Irakeko arabiera Irlandako gaelikoa (irlandera) Isanera islandiera italiera japoniera javera Jin txinera jorubera judu palestinar aramera Judu-aramera babiloniar juhuri (judeo-tat) k'iche'era kabardiera kabiliera kalmukera (kalmyk kirat) kambera kannada kantonera kapampangan karakalpakera Karakhanid karatxaiera-balkarera kareliera katalana kaxmirera kaxubiera kazakhera kekchi (Q'eqchi') Kelantan-Pattani Malay keningau murutera khakasera Khalaj khasiera khmerera kinyaruanda kirgizera kiribatiera kirundi kitxua klingon (Star Trek) koloniera (alemanaren kölsch edo kölnisch dialektoa) komi-permyak komi-zyriera Kongoko swahilia konkanera koreera kornubiera korsikera kotava (hizkuntza eraikien kodeak) Krimeako tatarera kroaziera kumykera kvenera láadan ladinoa (erretorromaniera) ladinoa (erretorromaniera) lakotera laoera Latgaliera latina lautadetako creera lazera letoniera Libyan Arabic liguriera limburgera lingala lingua franca nova lituaniera livoniera lojban lombardiera Louisianako kreolera luganda Lushootseed luxenburgera madurera Mahasu Pahari maithiliera malaysiera malaysiera malaysiera Maldivera malgaxea maltera mambaiera mandarin txinera Manipurera mantxuera manxera (Man uharteko gaelikoa) maoriera mapudunguna marathiera Marokoko arabiera marshallera Mauritaniako kreolera mazedoniera mendebaldeko mari Middle Persian (Pahlavi) mikmakera minangkabauera Mingreliera mirandesa mohawkera mokxera monera (Myanmar, Tailandia aldeko hizkuntza) mong Daw (miao zuria) mongoliera Mono (USA) Muskogee (Creek) nahuatl (azteka) Nande napoliera nauruera navajoera nederlandera (dutch) neoarameo asiriarra nepalera Newarera ngeq (Ta’Oi) Nigeriako fula niuera nogaiera Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Norvegiako bokmål Norvegiako nynorsk novial nuerera Nuosu Nyungar O'odham ojibwera Okinawera okzitaniera Old Frisian oriya (odia) Orizabako nahuatl ossetiera otomandar turkiera Palatinatuko alemana palauera Paliera pangasinanera papiamento paxtuera Pennsylvaniako alemaniera persiera piemontera Pikardiera pipilera poloniera portugesa prusiera zaharra pulaarera punjabera (ekialdekoa) punjabera (mendebaldekoa) Qashqai quenya rapanuiera rapmotz Rendille hizkuntza rohingyera rusinera sakha samoera samogitiera sango sanskritoa santalera Saraiki sardiniera serbiera Seychelleetako kreolera shanghaiera shonera (bantuera) shuswapera Silesiera sindarin ( J. R. R. Tolkien-ek asmatutako hizkuntza) sindhi sinhala siziliera somaliera South Levantine Arabic Southern Kurdish Southern Zaza (Dimli) srananera suediera Suitzako alemana sumeriera sundera swabiera swahilia swaziera Sylheti tagalo tagol murutera tahaggart tamahaq tahitiera tajikera talossera talyshera tamilera tangsa Tashelhit tatarera teluguera temuanera tetum thailandiera tibetera tigreera tigrinyera tmaziɣt tok pisin tokelauan toki pona Tonga (Zanbeziera) tongera tsongera tswanera tumbukera tupiera zaharra turkiera turkiera klasikoa turkmenera tuvaluera tuvera Txagatai hizkuntza txekiera txerokiera txetxenera txewera Txinako pidgin ingelesa txinera literarioa txuktxiera uab meto udmurtera uigurrera ukrainera umbundu urdua urhoboera uzbekera valoniera veneziera vepsera vietnamera Volapük-a võroera warayera Wayuu hizkuntza Western Armenian wolofera xawia xhosera xiang txinera yiddisha Yucatango maia hizkuntza zazaki Zeelandic zuluera Hizkuntza ezezaguna - Fitxategiaren deskripzioa
- Esaldi guztiak hautatutako hizkuntzan dauzka. Esaldi bakoitza id propio bati loturik dago eta ISO 639-3 hizkuntza kodea darama.
- Eremuak eta estruktura
- Esaldiaren id [tab] Hizkuntza [tab] Testua
Zehaztasunezko esaldiak
- Fitxategiaren izena
-
{{sentencesDetailed | filename}}
Hizkuntza guztiak Bakarrik esaldiak hemen: Jamaikako kreolera abkhazera adygheera afrihili afrikaansa aimara ainuera (Japoniako iparraldeko hizkuntza) aklanera albaniera alemana Aljeriako arabiera amazigera amazigera estandarra Amharera Ancient Hebrew anglo-saxoiera antzinako eskandinaviera Antzinako frantsesa antzinako gaztelania antzinako saxoiera Antzintako greziera arabiera aragoiera aramera zaharra Asiriera assamera asturiera avarera Awadhi azerbaijanera baliera Balutxi bambarera banjarera bavariera baxkirera baybay hizkuntza behe sorabiera (Dolnoserbski) behe-aleman (behe-saxoiera) bengalera Berom bhojpuri bieloerrusiera birmaniera Bislama bodoera bosniera bretoiera (brezhoneg) Brithenig bulgariera buryatera cayugera cebuera Central Kanuri Central Kurdish (Soranî) chamorro chavacano Chinook Jargon choctaw chuvashera coastal kadazan cuyononera CycL daniera Drents dunganera Eastern Armenian Egiptoko arabiera ekialdeko eslaviera zaharra Ekialdeko frisiera ekialdeko mari emiliar dialektoa Erdi Aroko frantsesa Erdi Aroko ingelesa erdialdeko bikolera erdialdeko dusunera erdialdeko Huastecako nahuatla erdialdeko mnong erretorromaniera erromaniera Erromintxela errumaniera errusiera erziera Eskoziako gaelikoa eslovakiera esloveniera esperantoa estoniera euskara Evenkera ewera (Niger-Kongo) extremadurera faroera feniziera fiji hindi fijiera finlandiera / suomiera frantsesa frisiera friulianera ga gaelikoa (Eskoziakoa) gagauzera galesera galiziera gan txinera garhwaliera gaztelania geg albaniera georgiera goi-sorabiera (hornjoserbšćina) Golkoko arabiera gotikoa greziera groenlandiera gronings Guadalupe uharteko frantses kreolera guaraniera Guerreroko nahuatlera gujaratiera haidera Haitiko kreolera hakka txinera hausa hawaiera hebreera hegoaldeko altaiera hegoaldeko haidera hegoaldeko min txinera hegoaldeko samiera hegoaldeko sothoera Hegoaldeko subanonera Hiligainonera hindia Hitchiti hmong njua/mong leng (miao berdea) hoera hungariera hunsrik ibanera idoa igboera ilocanoera indonesiera ingelesa ingriera, izhoriera Interglossa interlingua Interlingua inuitera Ipar Moluketako malayera ipar-ekialdeko arabiera Iparraldeko frisiera iparraldeko samiera Irakeko arabiera Irlandako gaelikoa (irlandera) Isanera islandiera italiera japoniera javera Jin txinera jorubera judu palestinar aramera Judu-aramera babiloniar juhuri (judeo-tat) k'iche'era kabardiera kabiliera kalmukera (kalmyk kirat) kambera kannada kantonera kapampangan karakalpakera Karakhanid karatxaiera-balkarera kareliera katalana kaxmirera kaxubiera kazakhera kekchi (Q'eqchi') Kelantan-Pattani Malay keningau murutera khakasera Khalaj khasiera khmerera kinyaruanda kirgizera kiribatiera kirundi kitxua klingon (Star Trek) koloniera (alemanaren kölsch edo kölnisch dialektoa) komi-permyak komi-zyriera Kongoko swahilia konkanera koreera kornubiera korsikera kotava (hizkuntza eraikien kodeak) Krimeako tatarera kroaziera kumykera kvenera láadan ladinoa (erretorromaniera) ladinoa (erretorromaniera) lakotera laoera Latgaliera latina lautadetako creera lazera letoniera Libyan Arabic liguriera limburgera lingala lingua franca nova lituaniera livoniera lojban lombardiera Louisianako kreolera luganda Lushootseed luxenburgera madurera Mahasu Pahari maithiliera malaysiera malaysiera malaysiera Maldivera malgaxea maltera mambaiera mandarin txinera Manipurera mantxuera manxera (Man uharteko gaelikoa) maoriera mapudunguna marathiera Marokoko arabiera marshallera Mauritaniako kreolera mazedoniera mendebaldeko mari Middle Persian (Pahlavi) mikmakera minangkabauera Mingreliera mirandesa mohawkera mokxera monera (Myanmar, Tailandia aldeko hizkuntza) mong Daw (miao zuria) mongoliera Mono (USA) Muskogee (Creek) nahuatl (azteka) Nande napoliera nauruera navajoera nederlandera (dutch) neoarameo asiriarra nepalera Newarera ngeq (Ta’Oi) Nigeriako fula niuera nogaiera Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Norvegiako bokmål Norvegiako nynorsk novial nuerera Nuosu Nyungar O'odham ojibwera Okinawera okzitaniera Old Frisian oriya (odia) Orizabako nahuatl ossetiera otomandar turkiera Palatinatuko alemana palauera Paliera pangasinanera papiamento paxtuera Pennsylvaniako alemaniera persiera piemontera Pikardiera pipilera poloniera portugesa prusiera zaharra pulaarera punjabera (ekialdekoa) punjabera (mendebaldekoa) Qashqai quenya rapanuiera rapmotz Rendille hizkuntza rohingyera rusinera sakha samoera samogitiera sango sanskritoa santalera Saraiki sardiniera serbiera Seychelleetako kreolera shanghaiera shonera (bantuera) shuswapera Silesiera sindarin ( J. R. R. Tolkien-ek asmatutako hizkuntza) sindhi sinhala siziliera somaliera South Levantine Arabic Southern Kurdish Southern Zaza (Dimli) srananera suediera Suitzako alemana sumeriera sundera swabiera swahilia swaziera Sylheti tagalo tagol murutera tahaggart tamahaq tahitiera tajikera talossera talyshera tamilera tangsa Tashelhit tatarera teluguera temuanera tetum thailandiera tibetera tigreera tigrinyera tmaziɣt tok pisin tokelauan toki pona Tonga (Zanbeziera) tongera tsongera tswanera tumbukera tupiera zaharra turkiera turkiera klasikoa turkmenera tuvaluera tuvera Txagatai hizkuntza txekiera txerokiera txetxenera txewera Txinako pidgin ingelesa txinera literarioa txuktxiera uab meto udmurtera uigurrera ukrainera umbundu urdua urhoboera uzbekera valoniera veneziera vepsera vietnamera Volapük-a võroera warayera Wayuu hizkuntza Western Armenian wolofera xawia xhosera xiang txinera yiddisha Yucatango maia hizkuntza zazaki Zeelandic zuluera Hizkuntza ezezaguna - Fitxategiaren deskripzioa
- Esaldi bakoitzarentzat eremu gehigarriak dauzka (jabearen izena, sorrera data/noiz aldatu zen).
- Eremuak eta estruktura
- Esaldiaren id [tab] Hizkuntza [tab] Testua [tab] Erabiltzaile izena [tab] Data gehitu da [tab] Azken aldaketaren data
Original and Translated Sentences
- Fitxategiaren izena
- sentences_base.tar.bz2
- Fitxategiaren deskripzioa
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Eremuak eta estruktura
- Esaldiaren id [tab] Base field
Esaldiak (CC0)
- Fitxategiaren izena
-
Hizkuntza guztiak Bakarrik esaldiak hemen: alemana Aljeriako arabiera amazigera amazigera estandarra Ancient Hebrew antzinako eskandinaviera Antzintako greziera arabiera aramera zaharra bengalera bieloerrusiera daniera Erdi Aroko ingelesa errusiera esperantoa feniziera finlandiera / suomiera frantsesa galesera gaztelania hebreera hindia hoera hungariera idoa ingelesa interlingua italiera japoniera judu palestinar aramera Judu-aramera babiloniar kabiliera kantonera kareliera katalana klingon (Star Trek) kvenera láadan ladinoa (erretorromaniera) latina liguriera mandarin txinera nederlandera (dutch) Norvegiako bokmål Nyungar Old Frisian poloniera portugesa santalera suediera Sylheti toki pona txekiera txinera literarioa ukrainera Volapük-a xawia yiddisha Hizkuntza ezezaguna - Fitxategiaren deskripzioa
- Honek batzen ditu CC0 lizentziarekin libre dauden esaldi guztiak.
- Eremuak eta estruktura
- Esaldiaren id [tab] Hizkuntza [tab] Testua [tab] Azken aldaketaren data
Estekak
- Fitxategiaren izena
- links.tar.bz2
- Fitxategiaren deskripzioa
- Esaldien arteko estekak gordetzen ditu. 1 [tab] 77 horrek esan nahi du #77 zenbakia duen esaldia #1 zenbakia duen esaldiaren itzulpena dela. Alderantzizko esteka ere hortxe dago, beraz fitxategiak lerro bat izango dut honako hau esaten: 77 [tab] 1.
- Eremuak eta estruktura
- Esaldiaren id [tab] Itzulpenaren id
Etiketak
- Fitxategiaren izena
- tags.tar.bz2
- Fitxategiaren deskripzioa
- Batzen ditu etiketenzerrenda esaldi bakoitzari lotuta. 381279 [tab] proverb horrek esan nahi du #381279 esaldia "proverb" etiketari esleitu zaiola.
- Eremuak eta estruktura
- Esaldiaren id [tab] Etiketaren izena
Zerrendak
- Fitxategiaren izena
- user_lists.tar.bz2
- Fitxategiaren deskripzioa
- Esaldien zerrendak dauzka bere baitan.
- Eremuak eta estruktura
- Azken id [tab] Erabiltzaile izena [tab] Data ezarri da [tab] Azken aldaketaren data [tab] Zerrendaren izena [tab] Honek edita dezake:
Esaldiak zerrendetan
- Fitxategiaren izena
- sentences_in_lists.tar.bz2
- Fitxategiaren deskripzioa
- Erakusten ditu edozein zerrendatan dauden esaldiak. 13 [tab] 381279 horrek esan nahi du #381279 zk. duen esaldia ID 13 duen zerrendan dagoela.
- Eremuak eta estruktura
- Azken id [tab] Esaldiaren id
Japoniar aurkibideak
- Fitxategiaren izena
- jpn_indices.tar.bz2
- Fitxategiaren deskripzioa
- Jim Breen-ek banatutako Tanaka Corpusaren "B lineak" horien parekoa gordetzen du. Ikus orri hau formatua jakiteko. Sarrera bakoitza Japoniera/Ingelesa pare bat esaldiei lotuta dago. Esaldiaren id horrek adierazten du jatorrizko japonierazko esaldiaren ID. Esanahiaren id horrek adierazten du bere itzulpena ingelesez.
- Eremuak eta estruktura
- Esaldiaren id [tab] Esanahiaren id [tab] Testua
Audioa duten estekak
- Fitxategiaren izena
- sentences_with_audio.tar.bz2
- Fitxategiaren deskripzioa
- Audioa eskuragarri daukaten hizkuntza guztietako esaldien ID helbideak gordetzen ditu. Beste eremuek zera adierazten dute, nork grabatu zuen audioa, zein lizentziapean argitara eman zuen eta egilea nor den jakiteko URL helbidea. Lizentziaren eremua hutsik baldin badago, agian lege arazoren bat egon liteke audio hori Tatoeba proiektutik kanpo erabiltzeko.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Eremuak eta estruktura
- Esaldiaren id [tab] Audio id [tab] Erabiltzaile izena [tab] Lizentzia [tab] Egiletza aitortzen duen URL
Erabiltzailearen trebetasun maila hizkuntza bakoitzean
- Fitxategiaren izena
- user_languages.tar.bz2
- Fitxategiaren deskripzioa
- Erabiltzaileek bere buruei buruz esandako hizkuntza gaitasun maila adierazten du zenbait hizkuntzatan.
- Eremuak eta estruktura
- Hizkuntza [tab] Trebetasun maila [tab] Erabiltzaile izena [tab] Zehaztasunak
Erabiltzaileen esaldien berrikusketak
- Fitxategiaren izena
- users_sentences.csv
- Fitxategiaren deskripzioa
- Erabiltzaileek berrikusitako esaldiak gordetzen du. Berrikusketaren balioa izan daiteke -1 (ez dago ondo), 0 (zalantzazkoa), or 1 (Ondo). Kontuz: aukera hau beta fasean dago.
- Eremuak eta estruktura
- Erabiltzaile izena [tab] Esaldiaren id [tab] Berrikusi [tab] Data gehitu da [tab] Azken aldaketaren data
Transkripzioak
- Fitxategiaren izena
-
Hizkuntza guztiak Bakarrik esaldiak hemen: japoniera kantonera mandarin txinera uzbekera - Fitxategiaren deskripzioa
- Honek gordetzen ditu script alternatibo edo alboko script guztien transkripzioak. Transkripzioari lotutako erabiltzaile-izenak erakusten du scripta nork berrikusi edo aldatu duen, azken aldaketa nork egin duen. Transkripzio batek ez badu erabiltzaile-izenik alboan ez du inork berrikusi. Script-aren izena ISO 15924 standard-aren arabera ezarri egiten da.
- Eremuak eta estruktura
- Esaldiaren id [tab] Hizkuntza [tab] Script-aren izena [tab] Erabiltzaile izena [tab] Transkripzioa