menu
Tatoeba
language
Luo käyttäjätili Kirjaudu sisään
language Suomi
menu
Tatoeba

chevron_right Luo käyttäjätili

chevron_right Kirjaudu sisään

Selaa

chevron_right Näytä satunnainen lause

chevron_right Selaa kielen mukaan

chevron_right Selaa listan mukaan

chevron_right Selaa tunnisteen mukaan

chevron_right Selaa äänitteitä

Yhteisö

chevron_right Seinä

chevron_right Luettelo kaikista jäsenistä

chevron_right Jäsenten kielet

chevron_right Äidinkieliset puhujat

search
clear
swap_horiz
search

Huomautus

Tässä tarjolla olevat tiedot EIVÄT ole hyödyllisiä, jollet koodaa kielityökalua tai käsittele tietoja.

Jos haluat vain lauseita, joita voit käyttää kielen opiskelussa, käy katsomassa lauselistoja. Voit kerätä kokoon oman listasi tai katsella listoja, jotka muut ovat luoneet. Voit ladata listan koneellesi ja tulostaa sen.

Yleistä tietoa tiedostoista

Useat japanin- ja englanninkieliset lauseet ovat peräisin Tanaka-korpuksesta, joka on tekijänoikeusvapaa.

Creative commons

Näiden tiedostojen lisenssi on CC BY 2.0 FR.

Creative Commons License CC-BY

Osa lauseistamme on saatavilla myös lisenssillä CC0 1.0.

Creative Commons License CC0

Äänitteet kattavat lisenssit

Äänitiedoston kattavan lisenssin valitsee äänitteen lisännyt avustaja ja lisenssi näytetään sivulla, jolla luetellaan kaikki kyseisen avustajan lisäämät äänitiedostot.

Kysymyksiä?

Jos sinulla on kysymyksiä tai pyyntöjä, otathan meihin yhteyttä. Vastaamme yleensä nopeasti.

Lataukset

arrow_back

Räätälöi vientiä

Lauseparit

Käytä tätä työkalua, kun haluat ladata räätälöityjä vientitiedostoja.

translate Lauseparit
Lataa kaikki A-kieliset lauseet, joilla on B-kielinen käännös

Lataa kaikki B-kielelle käännetyt A-kieliset lauseet käännöksineen.

Viikkoraportit

info Tässä olevat tiedostot päivitetään joka lauantai kello 6.30 (UTC).

Lauseet

Tiedoston nimi

{{sentences | filename}}

kaikki kielet
Lauseet vain: abaza abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania altai amhara arabia arabia (Algeria) arabianlahdenarabia aragonia assami asturia avaari awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet berom bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano (chabacano) cherokee chinook wawa chinyanja choctawi cuyonon cycL divehi drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelä-zaza (dimli) etelähaida eteläkurdi etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda garhwali gegi georgia gootti groningeninhollanti grönlanti (kalaallisut) Guadeloupen kreoli guarani gudžarati (gujarati) Guerreron nahuatli Gun haiti (haitin kreoli) hakassi haladži hausa havaiji heprea hichiti hiligaino (ilonggo) hindi hmong daw ho hollanti hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interglossa interlingua interlingue interslaavi inuktikut irakinarabia isan islanti italia itäarmenia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabardi kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kaškai kašmiri kašubi katalaani kazakki kekchi Kelantan-Pattanin malaiji keningau murut Keski-Huastecan nahuatli keskibikol keskienglanti keskikanuri keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (jin) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati kirundi klingon komi-syrjääni komipermjakki kongon swahili konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurmandži kveeni kymri kölschin murre láadan ladin ladino (juutalaisespanja) lakota lao latgalli latina latvia lazi lezgi libyanarabia liettua liguuri liivi limburg lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsiarmenia länsipandžabi madura mahasu pahari maithili makedonia malagassi malaiji malaiji malajalam malta mambai manipuri manksi mantšu maori mapudungun marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia mono (USA) morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisfriisi muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaisturkki muskogee naga (tangshang) nahuatli nande napoli nauru navajo (navaho) nawat nepali newari ngeq nigerianfulani niittymari (itämari) niue nogai norja (kirjanorja) norja (uusnorja) novial nuer nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjois-zaza (kirmanji) pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska rapanui rendille retoromaani rohingya (rohinja) romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti santali saraiki sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali (singaleesi/sinhala) sisilia skotti sleesia slovakki sloveeni somali šona (shona) soranî speedwords sranantongo sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi sylheti syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tašelhit tataari telugu temuan tetum thai tigre tigrinja tiibet timor tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana tumbuka Tupinambá turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu urhobo uzbekki vakioitu tamazight valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari (länsimari) waray wayuu West-Central Oromo wolof xhosa yläsorbi zaza zeeland zulu tuntematon kieli
Tiedoston kuvaus
Sisältää kaikki lauseet valitulla kielellä. Jokaisella lauseella on uniikki lausenumero ja ISO 639-3-kielikoodi.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti

Lauseiden yksityiskohdat

Tiedoston nimi

{{sentencesDetailed | filename}}

kaikki kielet
Lauseet vain: abaza abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania altai amhara arabia arabia (Algeria) arabianlahdenarabia aragonia assami asturia avaari awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet berom bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano (chabacano) cherokee chinook wawa chinyanja choctawi cuyonon cycL divehi drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelä-zaza (dimli) etelähaida eteläkurdi etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda garhwali gegi georgia gootti groningeninhollanti grönlanti (kalaallisut) Guadeloupen kreoli guarani gudžarati (gujarati) Guerreron nahuatli Gun haiti (haitin kreoli) hakassi haladži hausa havaiji heprea hichiti hiligaino (ilonggo) hindi hmong daw ho hollanti hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interglossa interlingua interlingue interslaavi inuktikut irakinarabia isan islanti italia itäarmenia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabardi kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kaškai kašmiri kašubi katalaani kazakki kekchi Kelantan-Pattanin malaiji keningau murut Keski-Huastecan nahuatli keskibikol keskienglanti keskikanuri keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (jin) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati kirundi klingon komi-syrjääni komipermjakki kongon swahili konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurmandži kveeni kymri kölschin murre láadan ladin ladino (juutalaisespanja) lakota lao latgalli latina latvia lazi lezgi libyanarabia liettua liguuri liivi limburg lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsiarmenia länsipandžabi madura mahasu pahari maithili makedonia malagassi malaiji malaiji malajalam malta mambai manipuri manksi mantšu maori mapudungun marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia mono (USA) morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisfriisi muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaisturkki muskogee naga (tangshang) nahuatli nande napoli nauru navajo (navaho) nawat nepali newari ngeq nigerianfulani niittymari (itämari) niue nogai norja (kirjanorja) norja (uusnorja) novial nuer nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjois-zaza (kirmanji) pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska rapanui rendille retoromaani rohingya (rohinja) romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti santali saraiki sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali (singaleesi/sinhala) sisilia skotti sleesia slovakki sloveeni somali šona (shona) soranî speedwords sranantongo sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi sylheti syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tašelhit tataari telugu temuan tetum thai tigre tigrinja tiibet timor tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana tumbuka Tupinambá turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu urhobo uzbekki vakioitu tamazight valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari (länsimari) waray wayuu West-Central Oromo wolof xhosa yläsorbi zaza zeeland zulu tuntematon kieli
Tiedoston kuvaus
Sisältää kunkin lauseen lisäkentät (omistajan nimi, luomispäivämäärä, muokkauspäivämäärä).
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Käyttäjätunnus [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä

Alkuperäiset ja käännetyt lauseet

Tiedoston nimi
sentences_base.tar.bz2
Tiedoston kuvaus
Jokainen lause on luetteloitu joko alkuperäisenä tai toisen lauseen käännöksenä. Peruskentällä voi olla seuraavat arvot:
  • nolla: Lause on alkuperäinen, ei käännös.
  • yli nolla: Sen lauseen lausenumero, josta tämä lause on käännetty.
  • \N: Tuntematon (harvinainen)
Kentät ja rakenne
Lausenumero [sarkain] Peruskenttä

Lauseet (CC0)

Tiedoston nimi

{{sentencesCC0 | filename}}

kaikki kielet
Lauseet vain: arabia arabia (Algeria) bengali berberikielet englanti espanja esperanto foinikia heprea hindi ho hollanti ido interlingua interlingue italia japani jiddiš juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabyyli kantoninkiina karjala katalaani keskienglanti kiina (kirjallinen) kiina (mandariini) klingon konkani kveeni kymri láadan ladino (juutalaisespanja) latina liguuri muinaisaramea muinaisfriisi muinaisheprea muinaiskreikka muinaisnorja norja (kirjanorja) nyungar orija portugali puola ranska ruotsi saksa santali suomi sylheti tanska tašawit toki pona tšekki ukraina unkari vakioitu tamazight valkovenäjä venäjä volapük tuntematon kieli
Tiedoston kuvaus
Sisältää kaikki lauseet, jotka ovat saatavilla CC0-lisenssillä.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Viimeisin muokkauspäivämäärä

Linkit

Tiedoston nimi
links.tar.bz2
Tiedoston kuvaus
Sisältää lauseiden väliset linkit. 1 [sarkain] 77 tarkoittaa, että lause numero 77 on lauseen numero 1 käännös. Myös lauseiden keskinäinen linkki on annettu, joten tiedosto sisältää myös rivin, jolla sanotaan 77 [sarkain] 1.
Kentät ja rakenne
Lausenumero [sarkain] Käännöslauseen numero

Tunnisteet

Tiedoston nimi
tags.tar.bz2
Tiedoston kuvaus
Sisältää listan tunnisteista, jotka liittyvät kuhunkin lauseeseen. 381279 [sarkain] proverb tarkoittaa, että lauseessa numero 381279 on tunniste ”proverb”.
Kentät ja rakenne
Lausenumero [sarkain] Tunnisteen nimi

Listat

Tiedoston nimi
user_lists.tar.bz2
Tiedoston kuvaus
Sisältää luettelon lauselistoista.
Kentät ja rakenne
Listan tunnistenumero [sarkain] Käyttäjätunnus [sarkain] Luomispäivämärää [sarkain] Viimeisin muokkauspäivämäärä [sarkain] Listan nimi [sarkain] Muokkaajat

Lauseet listoissa

Tiedoston nimi
sentences_in_lists.tar.bz2
Tiedoston kuvaus
Ilmaisee lauseet, jotka ovat osana mitä tahansa listaa. 13 [sarkain] 381279 tarkoittaa, että lause #381279 on listalla, jonka tunnistenumero on 13.
Kentät ja rakenne
Listan tunnistenumero [sarkain] Lausenumero

Japanin indeksoinnit

Tiedoston nimi
jpn_indices.tar.bz2
Tiedoston kuvaus
Sisältää Jim Breenin jakeleman Tanaka-korpustiedoston ”B-rivien” vastineen. Katso tältä sivulta tietoja muotoilusta. Jokainen merkintä liittyy japani/englanti-lausepariin. Lausenumero viittaa japaninkielisen lauseen numeroon. Merkitysen tunnistenumero viittaa englanninkielisen lauseen numeroon.
Kentät ja rakenne
Lausenumero [sarkain] Merkitysen tunnistenumero [sarkain] Teksti

Lauseet, joissa on äänite

Tiedoston nimi
sentences_with_audio.tar.bz2
Tiedoston kuvaus
Sisältää lauseiden tunnistenumerot niillä kaikilla kielillä, joilla äänite on saatavilla. Muut kentät ilmaisevat kuka on äänittänyt äänitteen, sen lisenssin ja URL-osoitteen, jota käytetään tekijän nimeämisessä. Jos lisenssikenttä on tyhjä, et voi käyttää lausetta Tatoeba-projektin ulkopuollella.
Ladataan äänitteitä
Yksittäisellä lauseella voi olla yksi tai useampia äänitteitä, kukin eri puhujalta. Ladataksesi tietyn tai tietyt äänitteet käytä äänitetunnistetta latauslinkin luomiseksi. Esimerkiksi, ladataksesi äänitteen, jonka äänitetunnus on 1234, käytä URL-osoitetta https://tatoeba.org/audio/download/1234.
Kentät ja rakenne
Lausenumero [sarkain] Äänitetunniste [sarkain] Käyttäjätunnus [sarkain] Lisenssi [sarkain] Tekijän nimeämisessä käytettävä URL

Käyttäjän taitotaso kielittäin

Tiedoston nimi
user_languages.tar.bz2
Tiedoston kuvaus
Ilmaisee käyttäjien itse kertoman taitotason yksittäisissä kielissä.
Kentät ja rakenne
Kieli [sarkain] Taitotaso [sarkain] Käyttäjätunnus [sarkain] Tarkemmat tiedot

Käyttäjän lausearvostelut

Tiedoston nimi
users_sentences.csv
Tiedoston kuvaus
Sisältää käyttäjien arvostelemat lauseet. Arvostelun arvo voi olla -1 (lause ei ole OK), 0 (ei osaa päättää tai epävarma) tai 1 (lause on OK). Varoitus: tämä tietoaineisto on vielä kokeiluvaiheessa.
Kentät ja rakenne
Käyttäjätunnus [sarkain] Lausenumero [sarkain] Arvostelu [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä

Transkriptiot

Tiedoston nimi

{{transcriptions | filename}}

kaikki kielet
Lauseet vain: japani kantoninkiina kiina (mandariini) uzbekki
Tiedoston kuvaus
Sisältää kaikki transkriptiot avustavalla tai vaihtoehtoisilla kirjoitusjärjestelmillä. Kirjoitusjärjestelmän nimeen liittyvä käyttäjänimi osoittaa käyttäjän, joka viimeksi kävi läpi ja mahdollisesti muokkasi transkriptiota. Transkriptiota, johon ei liity käyttäjänimeä, ei ole merkitty läpikäydyksi. Kirjoitusjärjestelmän nimi on määritelty ISO 15924 -standardin mukaisesti.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Kirjoitusjärjestelmän nimi [sarkain] Käyttäjätunnus [sarkain] Transkriptio