menu
Tatoeba
language
Luo käyttäjätili Kirjaudu sisään
language Suomi
menu
Tatoeba

chevron_right Luo käyttäjätili

chevron_right Kirjaudu sisään

Selaa

chevron_right Näytä satunnainen lause

chevron_right Selaa kielen mukaan

chevron_right Selaa listan mukaan

chevron_right Selaa tunnisteen mukaan

chevron_right Selaa äänitteitä

Yhteisö

chevron_right Seinä

chevron_right Luettelo kaikista jäsenistä

chevron_right Jäsenten kielet

chevron_right Äidinkieliset puhujat

search
clear
{{language.name}} Kieltä ei löytynyt.
swap_horiz
{{language.name}} Kieltä ei löytynyt.
search

Huomautus

Tässä tarjolla olevat tiedot EIVÄT ole hyödyllisiä, jollet koodaa kielityökalua tai käsittele tietoja.

Jos haluat vain lauseita, joita voit käyttää kielen opiskelussa, käy katsomassa lauselistoja. Voit kerätä kokoon oman listasi tai katsella listoja, jotka muut ovat luoneet. Voit ladata listan koneellesi ja tulostaa sen.

Yleistä tietoa tiedostoista

Tässä olevat tiedostot päivitetään joka lauantai kello 6.30 (UTC).

Useat japanin- ja englanninkieliset lauseet ovat peräisin Tanaka-korpuksesta, joka on tekijänoikeusvapaa.

Creative commons

Näiden tiedostojen lisenssi on CC BY 2.0 FR.

Creative Commons License CC-BY

Osa lauseistamme on saatavilla myös lisenssillä CC0 1.0.

Creative Commons License CC0

Äänitteet kattavat lisenssit

Äänitiedoston kattavan lisenssin valitsee äänitteen lisännyt avustaja ja lisenssi näytetään sivulla, jolla luetellaan kaikki kyseisen avustajan lisäämät äänitiedostot.

Kysymyksiä?

Jos sinulla on kysymyksiä tai pyyntöjä, otathan meihin yhteyttä. Vastaamme yleensä nopeasti.

Lataukset

Lauseet

Tiedoston nimi

{{sentences | filename}}

kaikki kielet
Lauseet vain: abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania amhara arabia arabia (Algeria) arabianlahdenarabia aragonia armenia assami asturia awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano/chabacano cherokee chinook wawa chinyanja choctawi cuyonon cycL Divehin kieli drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelähaida etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda Garhwali gegi georgia gootti groningeninhollanti grönlanti/kalaallisut Guadeloupen kreoli guarani gudžarati/gujarati Guerreron nahuatli haiti/haitin kreoli hakassi hausa havaiji heprea hiligaino/ilonggo hindi hmong daw hollanti Hon kieli hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interlingua interlingue inuktikut irakinarabia isan islanti italia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš jin-kiina joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kašmiri kašubi katalaani kazakki kekchi keningau murut Keski-Huastecan nahuatli Keskibikol keskienglanti keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati Kirundi klingon komi-syrjääni komipermjakki konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurdi kveeni kymri kölschin murre láadan ladin ladino/juutalaisespanja lakota lao latgalli latina latvia lazi Libyanarabia liettua liguuri liivi lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsipandžabi madura maithili makedonia malagassi malaiji malaiji malajalam malta mambai Manipurin kieli manksi mantšu maori marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaistupi muinaisturkki naga (tangshang) nahuatli Naurun kieli navajo/navaho nawat nepali newari ngeq nigerianfulani niittymari/itämari niue nogai norja (kirjanorja) norja (uusnorja) novial nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska Rapanuin kieli rendille retoromaani romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali/singaleesi/sinhala sisilia skotti slovakki sloveeni somali šona/shona speedwords sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tataari telugu temuan tetum thai tigre tigrinja tiibet Timorin kieli tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu Urhobo uzbekki valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari/länsimari waray wolof xhosa yläsorbi zaza zulu tuntematon kieli
Tiedoston kuvaus
Sisältää kaikki lauseet valitulla kielellä. Jokaisella lauseella on uniikki lausenumero ja ISO 639-3-kielikoodi.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti

Lauseiden yksityiskohdat

Tiedoston nimi

{{sentencesDetailed | filename}}

kaikki kielet
Lauseet vain: abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania amhara arabia arabia (Algeria) arabianlahdenarabia aragonia armenia assami asturia awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano/chabacano cherokee chinook wawa chinyanja choctawi cuyonon cycL Divehin kieli drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelähaida etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda Garhwali gegi georgia gootti groningeninhollanti grönlanti/kalaallisut Guadeloupen kreoli guarani gudžarati/gujarati Guerreron nahuatli haiti/haitin kreoli hakassi hausa havaiji heprea hiligaino/ilonggo hindi hmong daw hollanti Hon kieli hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interlingua interlingue inuktikut irakinarabia isan islanti italia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš jin-kiina joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kašmiri kašubi katalaani kazakki kekchi keningau murut Keski-Huastecan nahuatli Keskibikol keskienglanti keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati Kirundi klingon komi-syrjääni komipermjakki konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurdi kveeni kymri kölschin murre láadan ladin ladino/juutalaisespanja lakota lao latgalli latina latvia lazi Libyanarabia liettua liguuri liivi lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsipandžabi madura maithili makedonia malagassi malaiji malaiji malajalam malta mambai Manipurin kieli manksi mantšu maori marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaistupi muinaisturkki naga (tangshang) nahuatli Naurun kieli navajo/navaho nawat nepali newari ngeq nigerianfulani niittymari/itämari niue nogai norja (kirjanorja) norja (uusnorja) novial nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska Rapanuin kieli rendille retoromaani romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali/singaleesi/sinhala sisilia skotti slovakki sloveeni somali šona/shona speedwords sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tataari telugu temuan tetum thai tigre tigrinja tiibet Timorin kieli tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu Urhobo uzbekki valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari/länsimari waray wolof xhosa yläsorbi zaza zulu tuntematon kieli
Tiedoston kuvaus
Sisältää kunkin lauseen lisäkentät (omistajan nimi, luomispäivämäärä, muokkauspäivämäärä).
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Käyttäjätunnus [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä

Lauseiden perusta

Tiedoston nimi
sentences_base.tar.bz2
Tiedoston kuvaus
Lause perustuu toiseen lauseeseen, jos se on alunperin lisätty käännöksenä. Jokainen lause yhdistyy perustaan, joka voi olla:
  • nolla: lause on alkuperäinen eikä perustu toiseen lauseeseen.
  • suurempi kuin 0: Sen lauseen lausenumero, johon tämä lause perustuu.
  • \N: Ei tiedossa. Tämä on harvinaista, mutta meillä on kourallinen lauseita, joista emme osaa sanoa onko ne lisätty käännöksinä vai ei.
Kentät ja rakenne
Lausenumero [sarkain] Lauseen perusta

Lauseet (CC0)

Tiedoston nimi

{{sentencesCC0 | filename}}

kaikki kielet
Lauseet vain: arabia berberikielet englanti espanja esperanto foinikia heprea hollanti ido inkeroinen interlingua islanti italia jiddiš juutalais–babylonialainen aramea kabyyli kantoninkiina karjala katalaani keskienglanti kiina (kirjallinen) klingon kveeni latina liguuri muinaisaramea norja (kirjanorja) nyungar portugali puola ranska saksa suomi tanska tašawit tšekki ukraina unkari valkovenäjä venäjä volapük tuntematon kieli
Tiedoston kuvaus
Sisältää kaikki lauseet, jotka ovat saatavilla CC0-lisenssillä.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Viimeisin muokkauspäivämäärä

Linkit

Tiedoston nimi
links.tar.bz2
Tiedoston kuvaus
Sisältää lauseiden väliset linkit. 1 [sarkain] 77 tarkoittaa, että lause numero 77 on lauseen numero 1 käännös. Myös lauseiden keskinäinen linkki on annettu, joten tiedosto sisältää myös rivin, jolla sanotaan 77 [sarkain] 1.
Kentät ja rakenne
Lausenumero [sarkain] Käännöslauseen numero

Tunnisteet

Tiedoston nimi
tags.tar.bz2
Tiedoston kuvaus
Sisältää listan tunnisteista, jotka liittyvät kuhunkin lauseeseen. 381279 [sarkain] proverb tarkoittaa, että lauseessa numero 381279 on tunniste ”proverb”.
Kentät ja rakenne
Lausenumero [sarkain] Tunnisteen nimi

Listat

Tiedoston nimi
user_lists.tar.bz2
Tiedoston kuvaus
Sisältää luettelon lauselistoista.
Kentät ja rakenne
Listan tunnistenumero [sarkain] Käyttäjätunnus [sarkain] Luomispäivämärää [sarkain] Viimeisin muokkauspäivämäärä [sarkain] Listan nimi [sarkain] Muokkaajat

Lauseet listoissa

Tiedoston nimi
sentences_in_lists.tar.bz2
Tiedoston kuvaus
Ilmaisee lauseet, jotka ovat osana mitä tahansa listaa. 13 [sarkain] 381279 tarkoittaa, että lause #381279 on listalla, jonka tunnistenumero on 13.
Kentät ja rakenne
Listan tunnistenumero [sarkain] Lausenumero

Japanin indeksoinnit

Tiedoston nimi
jpn_indices.tar.bz2
Tiedoston kuvaus
Sisältää Jim Breenin jakeleman Tanaka-korpustiedoston ”B-rivien” vastineen. Katso tältä sivulta tietoja muotoilusta. Jokainen merkintä liittyy japani/englanti-lausepariin. Lausenumero viittaa japaninkielisen lauseen numeroon. Merkitysen tunnistenumero viittaa englanninkielisen lauseen numeroon.
Kentät ja rakenne
Lausenumero [sarkain] Merkitysen tunnistenumero [sarkain] Teksti

Lauseet, joissa on äänite

Tiedoston nimi
sentences_with_audio.tar.bz2
Tiedoston kuvaus
Sisältää lauseiden tunnistenumerot niillä kaikilla kielillä, joilla äänite on saatavilla. Muut kentät ilmaisevat kuka on äänittänyt äänitteen, sen lisenssin ja URL-osoitteen, jota käytetään tekijän nimeämisessä. Jos lisenssikenttä on tyhjä, et voi käyttää lausetta Tatoeba-projektin ulkopuollella.
Kentät ja rakenne
Lausenumero [sarkain] Käyttäjätunnus [sarkain] Lisenssi [sarkain] Tekijän nimeämisessä käytettävä URL

Käyttäjän taitotaso kielittäin

Tiedoston nimi
user_languages.tar.bz2
Tiedoston kuvaus
Ilmaisee käyttäjien itse kertoman taitotason yksittäisissä kielissä.
Kentät ja rakenne
Kieli [sarkain] Taitotaso [sarkain] Käyttäjätunnus [sarkain] Tarkemmat tiedot

Käyttäjän lausearvostelut

Tiedoston nimi
users_sentences.csv
Tiedoston kuvaus
Sisältää käyttäjien arvostelemat lauseet. Arvostelun arvo voi olla -1 (lause ei ole OK), 0 (ei osaa päättää tai epävarma) tai 1 (lause on OK). Varoitus: tämä tietoaineisto on vielä kokeiluvaiheessa.
Kentät ja rakenne
Käyttäjätunnus [sarkain] Kieli [sarkain] Lausenumero [sarkain] Arvostelu [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä

Transkriptiot

Tiedoston nimi

{{transcriptions | filename}}

kaikki kielet
Lauseet vain: japani kantoninkiina kiina (mandariini) uzbekki
Tiedoston kuvaus
Sisältää kaikki transkriptiot avustavalla tai vaihtoehtoisilla kirjoitusjärjestelmillä. Kirjoitusjärjestelmän nimeen liittyvä käyttäjänimi osoittaa käyttäjän, joka viimeksi kävi läpi ja mahdollisesti muokkasi transkriptiota. Transkriptiota, johon ei liity käyttäjänimeä, ei ole merkitty läpikäydyksi. Kirjoitusjärjestelmän nimi on määritelty ISO 15924 -standardin mukaisesti.
Kentät ja rakenne
Lausenumero [sarkain] Kieli [sarkain] Kirjoitusjärjestelmän nimi [sarkain] Käyttäjätunnus [sarkain] Transkriptio