Opmerking
De data die je hier kunt vinden, zijn NIET nuttig, tenzij je een taal-tool programmeert of data verwerkt.
Als je gewoon zinnen wilt die je kunt gebruiken om een taal te leren, kijk dan op de zinnenlijsten. Je kan je eigen lijst maken, of de lijsten bekijken die anderen hebben aangemaakt. De lijsten kunnen gedownload en uitgeprint worden.
Algemene informatie over de bestanden
Veel van de Japanse en Engelse zinnen zijn afkomstig uit het Tanaka Corpus, dat voor iedereen beschikbaar is gesteld in het publieke domein.
Creative Commons
Deze bestanden zijn uitgebracht onder CC BY 2.0.
Een deel van onze zinnen is ook beschikbaar onder CC0 1.0.
Licenties voor audio
De licentie voor een audiobestand wordt gekozen door de bijdrager en wordt aangegeven op de pagina met de audiobestanden die hij of zij heeft bijgedragen.
Nog vragen?
Als je vragen of verzoeken hebt, kun je contact met ons opnemen. In het algemeen geven we snel antwoord.
Downloads
Gebruik dit hulpmiddel om geëxporteerde data op maat te genereren en downloaden.
Alle zinnen in taal A die naar taal B zijn vertaald downloaden, met de vertalingen erbij.
Zinnen
- Bestandsnaam
-
Alle talen Alleen zinnen in: Komi-Zurjeens Abchazisch Adygees Afrihili Afrikaans Ainu Aklanon Albanees Algerijns-Arabisch Amhaars Arabisch Aragonees Assamees Assyrisch Neo-Aramees Asturisch Avaars Awadhi Aymara Azerbeidzjaans Balinees Bambara Bandjarees Basjkiers Baskisch Baybayanon Beiers Beloetsji Bengaals Berbers Berg-Mari Berom Bhojpuri Birmaans Bislama Bodo Boerjatisch Bosnisch Bretons Brithenig Bulgaars Catalaans Cayuga Cebuano Centraal Dusun Centraal Koerdisch (Soranî) Centraal-Bikol Centraal-Huasteca-Nahuatl Centraal-Kanuri Centraal-Mnong Chagatai Chakassisch Chamorro Chavacano Cherokee Chinees Pidginengels Chinook Jargon Choctaw Cornisch Corsicaans Cuyunon CycL Deens Divehi Drents Duits Dungan Dutton World Speedwords Eastern Armenian Egyptisch-Arabisch Emiliaans Engels Erromintxela Erzja Esperanto Estisch Evenks Ewe Extremeens Faeröers Fenicisch Fijisch Fijisch Hindoestani Fins Frans Fries Friulisch Fula Ga Gagaoezisch Galicisch Ganyu Garhwali Gegisch Georgisch Golf-Arabisch Gotisch Grieks Groenlands Gronings Guadeloups Creools Guarani Guerrero-Nahuatl Gujarati Haïtiaans Creools Hakka Hausa Hawaïaans Hebreeuws Hiligaynon Hindi Hitchiti Hmong Daw (Wit) Hmong Njua (Groen) Ho Hongaars Hunsrik Iban Ido Iers Igbo IJslands Ilocano Indonesisch Ingrisch Interglossa Interlingua Interlingue Inuktitut Irakees-Arabisch Isaan Italiaans Jakoets Jamaicaans Patois Japans Javaans Jiddisch Jin Joods Babylonisch Aramees Joods-Palestijns Aramees Juhuri (Judeo-Tat) K'iche' Kabardijns Kabylisch Kadazan (Kustgebied) Kalmuks Kamba Kannada Kantonees Kapampangan Karachanid Karakalpaks Karatsjaj-Balkarisch Karelisch Kasjmiri Kasjoebisch Kazachs Kekchi (Q'eqchi') Kelantan-Pattani Maleis Keningau Murut Khalaj Khasi Khmer Kinyarwanda Kirgizisch Kiribati Kirundi Klassiek Chinees Klingon Koemuks Kölsch Komi-Permjaaks Konkani (Goan) Koreaans Kotava Krim-Tataars Kroatisch Kveens Láadan Ladinisch Ladinisch Lakota Laotiaans Latijn Lazisch Letgaals Lets Libisch-Arabisch Ligurisch Lijfs Limburgs Lingala Lingua Franca Nova Litouws Lojban Lombardisch Louisiana-Creools Luganda Lushootseed Luxemburgs Macedonisch Madoerees Mahasu Pahari Maithili Malayalam Maleis Maleisisch (informeel) Maltees Mambae Mandarijn Chinees Mantsjoe Manx Maori Mapudungun Marathi Marokkaans-Arabisch Marshallees Mauritiaans Meitei Mi’kmaq Middelengels Middelfrans Middelperzisch (Pahlavi) Minangkabaus Mingreels Minnanyu Mirandees Mohawk Moksja Mon Mongools Mono (VS) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Napolitaans Nauruaans Navajo Nederduits (Nedersaksisch) Nederlands Nedersorbisch Nepalbhasa Nepalees Ngeq Nigeriaans Fulfulde Niueaans Njunga Nogai Noord-Fries Noord-Haida Noord-Koerdisch (Kurmancî) Noord-Levantijns Arabisch Noord-Moluks Maleis Noord-Samisch Noord-Zaza (Dimili) Noord-Zaza (Kirmancki) Noors (Bokmål) Noors (Nynorsk) Nosu Novial Nuer Nyanja O'odham Occitaans Odia (Oriya) Oedmoerts Oeigoers Oekraïens Oezbeeks Ojibwe Okinawaans Oppersorbisch Orizaba-Nahuatl Osmaans Ossetisch Oud Tupi Oud-Aramees Oud-Grieks Oud-Hebreeuws Oud-Turks Oudengels Oudfrans Oudfries Oudnoors Oudpruisisch Oudrussisch Oudsaksisch Oudspaans Palaus Pali Paltsisch Pangasinan Papiaments Pasjtoe Pennsylvania-Duits Perzisch Picardisch Piëmontees Pipil Plains Cree Plateaumalagasi Pools Portugees Punjabi (Oost) Punjabi (West) Qashqai Quechua Quenya Rapa Nui Rendille Reto-Romaans Riffijns Roemeens Roetheens Rohingya Romani Russisch Samoaans Samogitisch Sango Sanskriet Santali Saraiki Sardijns Saterfries Schots Schots-Gaelisch Servisch Setswana Seychels Creools Shanghainees Shona Shuswap Siciliaans Silezisch Sindarijns Sindhi Singalees Sloveens Slowaaks Soemerisch Soendanees Somalisch Spaans Sranantongo Standaard Marokkaanse Berber Swahili Swahili (Congo-Kinshasa) Swazi Syrisch taal van Sylhet Tachawit Tadzjieks Tagalog Tagol Murut Tahaggart Tamahaq Tahitiaans Talossaans Talysjisch Tamil Tashelhiyt Tataars Telugu Temuaans Tetun Thai Tibetaans Tigre Tigrinya Toemboeka Toevaans Tok Pisin Tokelaus Toki Pona Tonga (Zambezi) Tongaans Tsjechisch Tsjetsjeens Tsjoektsjisch Tsjoevasjisch Tsonga Turkmeens Turks Tuvaluaans Uab Meto Umbundu Urdu Urhobo Venetiaans Vietnamees Volapük Võro Waals Waray-Waray Wayuu Weide-Mari Welsh Wepsisch West-Armeens Wit-Russisch Wolof Xhosa Xiangyu Yoruba Yucateeks Zaza Zeeuws Zoeloe Zuid-Altai Zuid-Haida Zuid-Koerdisch Zuid-Levantijns Arabisch Zuid-Samisch Zuid-Sotho Zuid-Subanen Zwabisch Zweeds Zwitserduits Onbekende taal - Bestandsomschrijving
- Bevat alle zinnen in de geselecteerde taal. Elke zin is gekoppeld aan een unieke id en een ISO 639-3 taalcode.
- Velden en structuur
- Zin-ID [tab] Taal [tab] Tekst
Gedetailleerde zinnen
- Bestandsnaam
-
{{sentencesDetailed | filename}}
Alle talen Alleen zinnen in: Komi-Zurjeens Abchazisch Adygees Afrihili Afrikaans Ainu Aklanon Albanees Algerijns-Arabisch Amhaars Arabisch Aragonees Assamees Assyrisch Neo-Aramees Asturisch Avaars Awadhi Aymara Azerbeidzjaans Balinees Bambara Bandjarees Basjkiers Baskisch Baybayanon Beiers Beloetsji Bengaals Berbers Berg-Mari Berom Bhojpuri Birmaans Bislama Bodo Boerjatisch Bosnisch Bretons Brithenig Bulgaars Catalaans Cayuga Cebuano Centraal Dusun Centraal Koerdisch (Soranî) Centraal-Bikol Centraal-Huasteca-Nahuatl Centraal-Kanuri Centraal-Mnong Chagatai Chakassisch Chamorro Chavacano Cherokee Chinees Pidginengels Chinook Jargon Choctaw Cornisch Corsicaans Cuyunon CycL Deens Divehi Drents Duits Dungan Dutton World Speedwords Eastern Armenian Egyptisch-Arabisch Emiliaans Engels Erromintxela Erzja Esperanto Estisch Evenks Ewe Extremeens Faeröers Fenicisch Fijisch Fijisch Hindoestani Fins Frans Fries Friulisch Fula Ga Gagaoezisch Galicisch Ganyu Garhwali Gegisch Georgisch Golf-Arabisch Gotisch Grieks Groenlands Gronings Guadeloups Creools Guarani Guerrero-Nahuatl Gujarati Haïtiaans Creools Hakka Hausa Hawaïaans Hebreeuws Hiligaynon Hindi Hitchiti Hmong Daw (Wit) Hmong Njua (Groen) Ho Hongaars Hunsrik Iban Ido Iers Igbo IJslands Ilocano Indonesisch Ingrisch Interglossa Interlingua Interlingue Inuktitut Irakees-Arabisch Isaan Italiaans Jakoets Jamaicaans Patois Japans Javaans Jiddisch Jin Joods Babylonisch Aramees Joods-Palestijns Aramees Juhuri (Judeo-Tat) K'iche' Kabardijns Kabylisch Kadazan (Kustgebied) Kalmuks Kamba Kannada Kantonees Kapampangan Karachanid Karakalpaks Karatsjaj-Balkarisch Karelisch Kasjmiri Kasjoebisch Kazachs Kekchi (Q'eqchi') Kelantan-Pattani Maleis Keningau Murut Khalaj Khasi Khmer Kinyarwanda Kirgizisch Kiribati Kirundi Klassiek Chinees Klingon Koemuks Kölsch Komi-Permjaaks Konkani (Goan) Koreaans Kotava Krim-Tataars Kroatisch Kveens Láadan Ladinisch Ladinisch Lakota Laotiaans Latijn Lazisch Letgaals Lets Libisch-Arabisch Ligurisch Lijfs Limburgs Lingala Lingua Franca Nova Litouws Lojban Lombardisch Louisiana-Creools Luganda Lushootseed Luxemburgs Macedonisch Madoerees Mahasu Pahari Maithili Malayalam Maleis Maleisisch (informeel) Maltees Mambae Mandarijn Chinees Mantsjoe Manx Maori Mapudungun Marathi Marokkaans-Arabisch Marshallees Mauritiaans Meitei Mi’kmaq Middelengels Middelfrans Middelperzisch (Pahlavi) Minangkabaus Mingreels Minnanyu Mirandees Mohawk Moksja Mon Mongools Mono (VS) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Napolitaans Nauruaans Navajo Nederduits (Nedersaksisch) Nederlands Nedersorbisch Nepalbhasa Nepalees Ngeq Nigeriaans Fulfulde Niueaans Njunga Nogai Noord-Fries Noord-Haida Noord-Koerdisch (Kurmancî) Noord-Levantijns Arabisch Noord-Moluks Maleis Noord-Samisch Noord-Zaza (Dimili) Noord-Zaza (Kirmancki) Noors (Bokmål) Noors (Nynorsk) Nosu Novial Nuer Nyanja O'odham Occitaans Odia (Oriya) Oedmoerts Oeigoers Oekraïens Oezbeeks Ojibwe Okinawaans Oppersorbisch Orizaba-Nahuatl Osmaans Ossetisch Oud Tupi Oud-Aramees Oud-Grieks Oud-Hebreeuws Oud-Turks Oudengels Oudfrans Oudfries Oudnoors Oudpruisisch Oudrussisch Oudsaksisch Oudspaans Palaus Pali Paltsisch Pangasinan Papiaments Pasjtoe Pennsylvania-Duits Perzisch Picardisch Piëmontees Pipil Plains Cree Plateaumalagasi Pools Portugees Punjabi (Oost) Punjabi (West) Qashqai Quechua Quenya Rapa Nui Rendille Reto-Romaans Riffijns Roemeens Roetheens Rohingya Romani Russisch Samoaans Samogitisch Sango Sanskriet Santali Saraiki Sardijns Saterfries Schots Schots-Gaelisch Servisch Setswana Seychels Creools Shanghainees Shona Shuswap Siciliaans Silezisch Sindarijns Sindhi Singalees Sloveens Slowaaks Soemerisch Soendanees Somalisch Spaans Sranantongo Standaard Marokkaanse Berber Swahili Swahili (Congo-Kinshasa) Swazi Syrisch taal van Sylhet Tachawit Tadzjieks Tagalog Tagol Murut Tahaggart Tamahaq Tahitiaans Talossaans Talysjisch Tamil Tashelhiyt Tataars Telugu Temuaans Tetun Thai Tibetaans Tigre Tigrinya Toemboeka Toevaans Tok Pisin Tokelaus Toki Pona Tonga (Zambezi) Tongaans Tsjechisch Tsjetsjeens Tsjoektsjisch Tsjoevasjisch Tsonga Turkmeens Turks Tuvaluaans Uab Meto Umbundu Urdu Urhobo Venetiaans Vietnamees Volapük Võro Waals Waray-Waray Wayuu Weide-Mari Welsh Wepsisch West-Armeens Wit-Russisch Wolof Xhosa Xiangyu Yoruba Yucateeks Zaza Zeeuws Zoeloe Zuid-Altai Zuid-Haida Zuid-Koerdisch Zuid-Levantijns Arabisch Zuid-Samisch Zuid-Sotho Zuid-Subanen Zwabisch Zweeds Zwitserduits Onbekende taal - Bestandsomschrijving
- Bevat extra velden voor elke zin (eigenaarsnaam, aanmaakdatum/wijziging).
- Velden en structuur
- Zin-ID [tab] Taal [tab] Tekst [tab] Gebruikersnaam [tab] Datum toegevoegd [tab] Datum voor het laatst gewijzigd
Originele en vertaalde zinnen
- Bestandsnaam
- sentences_base.tar.bz2
- Bestandsomschrijving
-
Elke zin staat aangegeven of als origineel of als een een vertaling van een ander. Het "basisveld" kan de volgende waarden hebben:
- nul: De zin is origineel, niet een vertaling van een andere.
- groter dan nul: Het ID van de zin waarvan hij vertaald is.
- \N: Onbekend (zeldzaam).
- Velden en structuur
- Zin-ID [tab] Basisveld
Zinnen (CC0)
- Bestandsnaam
-
Alle talen Alleen zinnen in: Algerijns-Arabisch Arabisch Bengaals Berbers Catalaans Deens Duits Engels Esperanto Fenicisch Fins Frans Hebreeuws Hindi Ho Hongaars Ido Interlingua Italiaans Japans Jiddisch Joods Babylonisch Aramees Joods-Palestijns Aramees Kabylisch Kantonees Karelisch Klassiek Chinees Klingon Kveens Láadan Ladinisch Latijn Ligurisch Mandarijn Chinees Middelengels Nederlands Njunga Noors (Bokmål) Oekraïens Oud-Aramees Oud-Grieks Oud-Hebreeuws Oudfries Oudnoors Pools Portugees Russisch Santali Spaans Standaard Marokkaanse Berber taal van Sylhet Tachawit Toki Pona Tsjechisch Volapük Welsh Wit-Russisch Zweeds Onbekende taal - Bestandsomschrijving
- Bevat alle zinnen beschikbaar onder CC0.
- Velden en structuur
- Zin-ID [tab] Taal [tab] Tekst [tab] Datum voor het laatst gewijzigd
Koppelingen
- Bestandsnaam
- links.tar.bz2
- Bestandsomschrijving
- Bevat de koppelingen tussen de zinnen. 1 [tab] 77 betekent dat zin nr. 77 de vertaling is van zin nr. 1. De wederzijdse link is ook aanwezig, zodat het bestand ook een lijn bevat waar 77 [tab] 1 in staat.
- Velden en structuur
- Zin-ID [tab] Vertaling-ID
Labels
- Bestandsnaam
- tags.tar.bz2
- Bestandsomschrijving
- Bevat de lijst van labels die horen bij elke zin. 381279 [tab] proverb betekent dat zin nr. 381279 de "proverb"-label is toegekend.
- Velden en structuur
- Zin-ID [tab] Labelnaam
Lijsten
- Bestandsnaam
- user_lists.tar.bz2
- Bestandsomschrijving
- Bevat de lijst met zinnenlijsten.
- Velden en structuur
- Lijst-ID [tab] Gebruikersnaam [tab] Datum aangemaakt [tab] Datum voor het laatst gewijzigd [tab] Lijstnaam [tab] Bewerkbaar door
Zinnen in lijsten
- Bestandsnaam
- sentences_in_lists.tar.bz2
- Bestandsomschrijving
- Geeft de zinnen aan die zich in een lijst bevinden. 13 [tab] 381279 betekent dat zin nr. 381279 zich in een lijst bevat met het nummer 13.
- Velden en structuur
- Lijst-ID [tab] Zin-ID
Japanse indexen
- Bestandsnaam
- jpn_indices.tar.bz2
- Bestandsomschrijving
- Bevat het equivalent van de "B-lijnen" in het Tanaka Corpus-bestand dat gedistribueerd wordt door Jim Breen. Zie deze pagina voor het formaat. Elk item wordt geassocieerd met een paar Japanse/Engelse zinnen. Zin-ID refereert naar het ID van de Japanse zin. Betekenis-ID refereert naar het ID van de Engelse zin.
- Velden en structuur
- Zin-ID [tab] Betekenis-ID [tab] Tekst
Zinnen met audio:
- Bestandsnaam
- sentences_with_audio.tar.bz2
- Bestandsomschrijving
- Bevat de IDs van de zinnen, in elke taal, waarvoor audio beschikbaar is. Andere velden geven aan wie de audio heeft opgenomen, de licentie en een URL om de auteur toe te wijzen. Als het licentieveld leeg is, mag je de audio niet hergebruiken buiten het Tatoeba-project.
- Geluidsbestand wordt gedownload
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Velden en structuur
- Zin-ID [tab] Audio id [tab] Gebruikersnaam [tab] Licentie [tab] Toewijzings-URL
Vaardigheidsniveau van gebruiker per taal
- Bestandsnaam
- user_languages.tar.bz2
- Bestandsomschrijving
- Toont de door leden zelf aangegeven taalvaardigheidsniveaus.
- Velden en structuur
- Taal [tab] Vaardigheidsniveau [tab] Gebruikersnaam [tab] Details
Beoordelingen van de zinnen van de gebruikers
- Bestandsnaam
- users_sentences.csv
- Bestandsomschrijving
- Bevat zinnen die door gebruikers zijn beoordeeld. De waarde van de beoordeling kan -1 (zin niet OK), 0 (onbeslist of onzeker) of 1 (zin OK) zijn. Waarschuwing: deze gegevens zijn nog steeds experimenteel.
- Velden en structuur
- Gebruikersnaam [tab] Zin-ID [tab] Beoordeling [tab] Datum toegevoegd [tab] Datum voor het laatst gewijzigd
Transcripties
- Bestandsnaam
-
Alle talen Alleen zinnen in: Japans Kantonees Mandarijn Chinees Oezbeeks - Bestandsomschrijving
- Bevat alle transcripties in hulp- of alternatieve scripts. Een gebruikersnaam die aan een transcriptie is gekoppeld, geeft de gebruiker aan die de transcriptie het laatst heeft beoordeeld en eventueel gewijzigd. Een transcriptie zonder gebruikersnaam is niet gemarkeerd als beoordeeld. De scriptnaam is gedefinieerd volgens de ISO 15924-norm.
- Velden en structuur
- Zin-ID [tab] Taal [tab] Scriptnaam [tab] Gebruikersnaam [tab] Transcriptie