Huomautus
Tässä tarjolla olevat tiedot EIVÄT ole hyödyllisiä, jollet koodaa kielityökalua tai käsittele tietoja.
Jos haluat vain lauseita, joita voit käyttää kielen opiskelussa, käy katsomassa lauselistoja. Voit kerätä kokoon oman listasi tai katsella listoja, jotka muut ovat luoneet. Voit ladata listan koneellesi ja tulostaa sen.
Yleistä tietoa tiedostoista
Useat japanin- ja englanninkieliset lauseet ovat peräisin Tanaka-korpuksesta, joka on tekijänoikeusvapaa.
Creative commons
Näiden tiedostojen lisenssi on CC BY 2.0 FR.

Osa lauseistamme on saatavilla myös lisenssillä CC0 1.0.

Äänitteet kattavat lisenssit
Äänitiedoston kattavan lisenssin valitsee äänitteen lisännyt avustaja ja lisenssi näytetään sivulla, jolla luetellaan kaikki kyseisen avustajan lisäämät äänitiedostot.
Kysymyksiä?
Jos sinulla on kysymyksiä tai pyyntöjä, otathan meihin yhteyttä. Vastaamme yleensä nopeasti.
Lataukset
Käytä tätä työkalua, kun haluat ladata räätälöityjä vientitiedostoja.
Lataa kaikki B-kielelle käännetyt A-kieliset lauseet käännöksineen.
Lauseet
- Tiedoston nimi
-
kaikki kielet Lauseet vain: abaza abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania altai amhara arabia arabia (Algeria) arabianlahdenarabia aragonia assami asturia avaari awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet berom bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano (chabacano) cherokee chinook wawa chinyanja choctawi cuyonon cycL divehi drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelä-zaza (dimli) etelähaida eteläkurdi etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda garhwali gegi georgia gootti groningeninhollanti grönlanti (kalaallisut) Guadeloupen kreoli guarani gudžarati (gujarati) Guerreron nahuatli Gun haiti (haitin kreoli) hakassi haladži hausa havaiji heprea hichiti hiligaino (ilonggo) hindi hmong daw ho hollanti hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interglossa interlingua interlingue interslaavi inuktikut irakinarabia isan islanti italia itäarmenia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabardi kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kaškai kašmiri kašubi katalaani kazakki kekchi Kelantan-Pattanin malaiji keningau murut Keski-Huastecan nahuatli keskibikol keskienglanti keskikanuri keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (jin) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati kirundi klingon komi-syrjääni komipermjakki kongon swahili konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurmandži kveeni kymri kölschin murre láadan ladin ladino (juutalaisespanja) lakota lao latgalli latina latvia lazi lezgi libyanarabia liettua liguuri liivi limburg lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsiarmenia länsipandžabi madura mahasu pahari maithili makedonia malagassi malaiji malaiji malajalam malta mambai manipuri manksi mantšu maori mapudungun marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia mono (USA) morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisfriisi muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaisturkki muskogee naga (tangshang) nahuatli nande napoli nauru navajo (navaho) nawat nepali newari ngeq nigerianfulani niittymari (itämari) niue nogai norja (kirjanorja) norja (uusnorja) novial nuer nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjois-zaza (kirmanji) pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska rapanui rendille retoromaani rohingya (rohinja) romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti santali saraiki sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali (singaleesi/sinhala) sisilia skotti sleesia slovakki sloveeni somali šona (shona) soranî speedwords sranantongo sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi sylheti syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tašelhit tataari telugu temuan tetum thai tigre tigrinja tiibet timor tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana tumbuka Tupinambá turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu urhobo uzbekki vakioitu tamazight valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari (länsimari) waray wayuu West-Central Oromo wolof xhosa yläsorbi zaza zeeland zulu tuntematon kieli - Tiedoston kuvaus
- Sisältää kaikki lauseet valitulla kielellä. Jokaisella lauseella on uniikki lausenumero ja ISO 639-3-kielikoodi.
- Kentät ja rakenne
- Lausenumero [sarkain] Kieli [sarkain] Teksti
Lauseiden yksityiskohdat
- Tiedoston nimi
-
{{sentencesDetailed | filename}}
kaikki kielet Lauseet vain: abaza abhaasi adyge afrihili afrikaans ainu aklanon alasaksa alasorbi albania altai amhara arabia arabia (Algeria) arabianlahdenarabia aragonia assami asturia avaari awadhi aymara azeri baijeri bali bambara banjar baski baškiiri baybay belutši bengali berberikielet berom bhodžpuri bislama bodo bosnia bretoni brithenig bulgaria burjaatti burma cayuga cebuano chavacano (chabacano) cherokee chinook wawa chinyanja choctawi cuyonon cycL divehi drents dungaani dusun egyptinarabia emialian kieli englanti erromintxela ersä espanja esperanto etelä-subanen etelä-zaza (dimli) etelähaida eteläkurdi etelälevantinarabia eteläsaame eteläsotho evenki ewe extremadura fidži fidžinhindi foinikia friisi friuli fääri ga gaeli (skotlanti) gagauzi galego ganda garhwali gegi georgia gootti groningeninhollanti grönlanti (kalaallisut) Guadeloupen kreoli guarani gudžarati (gujarati) Guerreron nahuatli Gun haiti (haitin kreoli) hakassi haladži hausa havaiji heprea hichiti hiligaino (ilonggo) hindi hmong daw ho hollanti hunsrückinsaksa iban ido igbo iiri iloko indonesia inkeroinen interglossa interlingua interlingue interslaavi inuktikut irakinarabia isan islanti italia itäarmenia itäfriisi itäpandžabi jaava jakuutti jamaikankreoli/patois japani jiddiš joruba juhuri jukatek juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabardi kabyyli kalmukki kamba kannada kantoninkiina karakalpakki karakhanid karatšai-balkaari karjala kaškai kašmiri kašubi katalaani kazakki kekchi Kelantan-Pattanin malaiji keningau murut Keski-Huastecan nahuatli keskibikol keskienglanti keskikanuri keskimnong keskiranska ketšua khasi khmer kiche kiina (gan) kiina (hakka) kiina (jin) kiina (kirjallinen) kiina (mandariini) kiina (min nan) kiina (xiang) kiinalainen pidginenglanti kirgiisi kiribati kirundi klingon komi-syrjääni komipermjakki kongon swahili konkani korea korni korsika kotava kreikka krimintataari kroatia kumykki kurmandži kveeni kymri kölschin murre láadan ladin ladino (juutalaisespanja) lakota lao latgalli latina latvia lazi lezgi libyanarabia liettua liguuri liivi limburg lingala lingua franca nova lojban lombardi louisianan kreoli lushootseed luxemburg länsiarmenia länsipandžabi madura mahasu pahari maithili makedonia malagassi malaiji malaiji malajalam malta mambai manipuri manksi mantšu maori mapudungun marathi marokonarabia marshall mbundu micmac minangkabau mingreli mirandeesi mohawk mokša mon mong njua mongolia mono (USA) morisyen muinaisaramea muinaisenglanti muinaisespanja muinaisfriisi muinaisheprea muinaisitäslaavi muinaiskreikka muinaisnorja muinaispreussi muinaisranska muinaissaksi muinaisturkki muskogee naga (tangshang) nahuatli nande napoli nauru navajo (navaho) nawat nepali newari ngeq nigerianfulani niittymari (itämari) niue nogai norja (kirjanorja) norja (uusnorja) novial nuer nyungar o’odham odžibwa okinawa oksitaani orija Orizaban nahuatli osmaninturkki osseetti paali pahlavi palau pampanga pangasinan papiamentu paštu pennsylvaniansaksa persia/farsi pfalzinsaksa picard piemonte pohjois-molukkien malaiji pohjois-yi pohjois-zaza (kirmanji) pohjoisfriisi pohjoishaida pohjoislevantinarabia pohjoissaame portugali pulaar puola quenya rannikkokadazan ranska rapanui rendille retoromaani rohingya (rohinja) romania romanikieli ruanda ruotsi ruteeni saksa samoa samogiitti sango sanskriitti santali saraiki sardi serbia seychellien kreoli shanghainkiina shuswap sindar sindhi sinhali (singaleesi/sinhala) sisilia skotti sleesia slovakki sloveeni somali šona (shona) soranî speedwords sranantongo sumeri sunda suomi svaabiansaksa sveitsin saksa swahili swazi sylheti syyria syyria tadžikki tagalog tagol murut tahiti tališi talossa tamahaq tamili tanska tarifit tasankocree tašawit tašelhit tataari telugu temuan tetum thai tigre tigrinja tiibet timor tok-pisin tokelau toki pona tonga tonga tšagatai tšamorro tšekki tšetšeeni tsonga tšuktšin tšuvassi tswana tumbuka Tupinambá turkki turkmeeni tuva tuvalu udmurtti uiguuri ukraina unkari urdu urhobo uzbekki vakioitu tamazight valkovenäjä valloni venetsian kieli venäjä vepsä vietnam viro volapük võro vuorimari (länsimari) waray wayuu West-Central Oromo wolof xhosa yläsorbi zaza zeeland zulu tuntematon kieli - Tiedoston kuvaus
- Sisältää kunkin lauseen lisäkentät (omistajan nimi, luomispäivämäärä, muokkauspäivämäärä).
- Kentät ja rakenne
- Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Käyttäjätunnus [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä
Alkuperäiset ja käännetyt lauseet
- Tiedoston nimi
- sentences_base.tar.bz2
- Tiedoston kuvaus
-
Jokainen lause on luetteloitu joko alkuperäisenä tai toisen lauseen käännöksenä. Peruskentällä voi olla seuraavat arvot:
- nolla: Lause on alkuperäinen, ei käännös.
- yli nolla: Sen lauseen lausenumero, josta tämä lause on käännetty.
- \N: Tuntematon (harvinainen)
- Kentät ja rakenne
- Lausenumero [sarkain] Peruskenttä
Lauseet (CC0)
- Tiedoston nimi
-
kaikki kielet Lauseet vain: arabia arabia (Algeria) bengali berberikielet englanti espanja esperanto foinikia heprea hindi ho hollanti ido interlingua interlingue italia japani jiddiš juutalais–babylonialainen aramea juutalais–palestiinalainen aramea kabyyli kantoninkiina karjala katalaani keskienglanti kiina (kirjallinen) kiina (mandariini) klingon konkani kveeni kymri láadan ladino (juutalaisespanja) latina liguuri muinaisaramea muinaisfriisi muinaisheprea muinaiskreikka muinaisnorja norja (kirjanorja) nyungar orija portugali puola ranska ruotsi saksa santali suomi sylheti tanska tašawit toki pona tšekki ukraina unkari vakioitu tamazight valkovenäjä venäjä volapük tuntematon kieli - Tiedoston kuvaus
- Sisältää kaikki lauseet, jotka ovat saatavilla CC0-lisenssillä.
- Kentät ja rakenne
- Lausenumero [sarkain] Kieli [sarkain] Teksti [sarkain] Viimeisin muokkauspäivämäärä
Linkit
- Tiedoston nimi
- links.tar.bz2
- Tiedoston kuvaus
- Sisältää lauseiden väliset linkit. 1 [sarkain] 77 tarkoittaa, että lause numero 77 on lauseen numero 1 käännös. Myös lauseiden keskinäinen linkki on annettu, joten tiedosto sisältää myös rivin, jolla sanotaan 77 [sarkain] 1.
- Kentät ja rakenne
- Lausenumero [sarkain] Käännöslauseen numero
Tunnisteet
- Tiedoston nimi
- tags.tar.bz2
- Tiedoston kuvaus
- Sisältää listan tunnisteista, jotka liittyvät kuhunkin lauseeseen. 381279 [sarkain] proverb tarkoittaa, että lauseessa numero 381279 on tunniste ”proverb”.
- Kentät ja rakenne
- Lausenumero [sarkain] Tunnisteen nimi
Listat
- Tiedoston nimi
- user_lists.tar.bz2
- Tiedoston kuvaus
- Sisältää luettelon lauselistoista.
- Kentät ja rakenne
- Listan tunnistenumero [sarkain] Käyttäjätunnus [sarkain] Luomispäivämärää [sarkain] Viimeisin muokkauspäivämäärä [sarkain] Listan nimi [sarkain] Muokkaajat
Lauseet listoissa
- Tiedoston nimi
- sentences_in_lists.tar.bz2
- Tiedoston kuvaus
- Ilmaisee lauseet, jotka ovat osana mitä tahansa listaa. 13 [sarkain] 381279 tarkoittaa, että lause #381279 on listalla, jonka tunnistenumero on 13.
- Kentät ja rakenne
- Listan tunnistenumero [sarkain] Lausenumero
Japanin indeksoinnit
- Tiedoston nimi
- jpn_indices.tar.bz2
- Tiedoston kuvaus
- Sisältää Jim Breenin jakeleman Tanaka-korpustiedoston ”B-rivien” vastineen. Katso tältä sivulta tietoja muotoilusta. Jokainen merkintä liittyy japani/englanti-lausepariin. Lausenumero viittaa japaninkielisen lauseen numeroon. Merkitysen tunnistenumero viittaa englanninkielisen lauseen numeroon.
- Kentät ja rakenne
- Lausenumero [sarkain] Merkitysen tunnistenumero [sarkain] Teksti
Lauseet, joissa on äänite
- Tiedoston nimi
- sentences_with_audio.tar.bz2
- Tiedoston kuvaus
- Sisältää lauseiden tunnistenumerot niillä kaikilla kielillä, joilla äänite on saatavilla. Muut kentät ilmaisevat kuka on äänittänyt äänitteen, sen lisenssin ja URL-osoitteen, jota käytetään tekijän nimeämisessä. Jos lisenssikenttä on tyhjä, et voi käyttää lausetta Tatoeba-projektin ulkopuollella.
- Ladataan äänitteitä
- Yksittäisellä lauseella voi olla yksi tai useampia äänitteitä, kukin eri puhujalta. Ladataksesi tietyn tai tietyt äänitteet käytä äänitetunnistetta latauslinkin luomiseksi. Esimerkiksi, ladataksesi äänitteen, jonka äänitetunnus on 1234, käytä URL-osoitetta https://tatoeba.org/audio/download/1234.
- Kentät ja rakenne
- Lausenumero [sarkain] Äänitetunniste [sarkain] Käyttäjätunnus [sarkain] Lisenssi [sarkain] Tekijän nimeämisessä käytettävä URL
Käyttäjän taitotaso kielittäin
- Tiedoston nimi
- user_languages.tar.bz2
- Tiedoston kuvaus
- Ilmaisee käyttäjien itse kertoman taitotason yksittäisissä kielissä.
- Kentät ja rakenne
- Kieli [sarkain] Taitotaso [sarkain] Käyttäjätunnus [sarkain] Tarkemmat tiedot
Käyttäjän lausearvostelut
- Tiedoston nimi
- users_sentences.csv
- Tiedoston kuvaus
- Sisältää käyttäjien arvostelemat lauseet. Arvostelun arvo voi olla -1 (lause ei ole OK), 0 (ei osaa päättää tai epävarma) tai 1 (lause on OK). Varoitus: tämä tietoaineisto on vielä kokeiluvaiheessa.
- Kentät ja rakenne
- Käyttäjätunnus [sarkain] Lausenumero [sarkain] Arvostelu [sarkain] Lisäyspäivämäärä [sarkain] Viimeisin muokkauspäivämäärä
Transkriptiot
- Tiedoston nimi
-
kaikki kielet Lauseet vain: japani kantoninkiina kiina (mandariini) uzbekki - Tiedoston kuvaus
- Sisältää kaikki transkriptiot avustavalla tai vaihtoehtoisilla kirjoitusjärjestelmillä. Kirjoitusjärjestelmän nimeen liittyvä käyttäjänimi osoittaa käyttäjän, joka viimeksi kävi läpi ja mahdollisesti muokkasi transkriptiota. Transkriptiota, johon ei liity käyttäjänimeä, ei ole merkitty läpikäydyksi. Kirjoitusjärjestelmän nimi on määritelty ISO 15924 -standardin mukaisesti.
- Kentät ja rakenne
- Lausenumero [sarkain] Kieli [sarkain] Kirjoitusjärjestelmän nimi [sarkain] Käyttäjätunnus [sarkain] Transkriptio