Hinweis
Die hier bereitgestellten Dateien sind nur zum Programmieren und zur Datenverarbeitung von Nutzen.
Wenn du an Sätzen zum Lernen interessiert bist, könnte sich ein Blick auf die Satzlisten lohnen. Du kannst eigene erstellen oder diejenigen anderer betrachten. Die Listen können heruntergeladen und ausgedruckt werden.
Allgemeine Informationen
Viele der japanischen und englischen Sätze gehören zum gemeinfreien Tanaka-Korpus.
Creative Commons
Diese Dateien stehen unter der Lizenz CC BY 2.0 FR zur Verfügung.
Ein Teil der Sätze steht auch unter der Lizenz CC0 1.0 zur Verfügung.
Lizenzen der Audiobeiträge
Die Wahl der Lizenz, unter welcher eine Audiodatei zur Verfügung gestellt wird, obliegt dem Urheber; sie kann auf der Seite seiner sämtlichen Audiobeiträge eingesehen werden.
Fragen?
Bei Fragen oder Anliegen nimm gerne Kontakt mit uns auf! Wir antworten in der Regel schnell.
Zum Herunterladen
Hier können je nach Bedarf benutzerdefinierte Exporte generiert und heruntergeladen werden.
Alle Sätze in Sprache A mit Übersetzungen in Sprache B zusammen mit diesen Übersetzungen herunterladen.
Sätze
- Dateiname
-
Alle Sprachen Nur Sätze in: Abchasisch Adyghe Afrihili Afrikaans Ainu Aklanon Albanisch Albanisch (Gegisch) Alt-Tupí Altenglisch Altfranzösisch Altfriesisch Altgriechisch Altnordisch Altostslawisch Altpreußisch Altsächsisch Altspanisch Alttürkisch Amharisch Antillen-Kreolisch Arabisch Arabisch (Ägypten) Arabisch (Algerien) Arabisch (Golf) Arabisch (Irak) Arabisch (Marokko) Arabisch (nordlevantinisch) Arabisch (Südlevantinisch) Aragonesisch Aramäisch (Alt-) Aramäisch (Assyrisch-Neu-) Aramäisch (jüdisch-babylonisch) Aramäisch (jüdisch-palästinisch) Armenisch (Ost-) Aserbaidschanisch Assamesisch Asturisch Awadhi Awarisch Aymara Bairisch Balinesisch Bambara Banjaresisch Baschkirisch Baskisch Baybayisch Belutschi Bengalisch Berberisch Berom Bhojpuri Bikol (Zentral) Bislama Bodo Bosnisch Bretonisch Brithenig Bulgarisch Burjatisch Burmesisch Cayuga Cebuano Chakassisch Chaladschisch Chamorro Chavacano Cherokee Chinesisch (Gan) Chinesisch (Hakka) Chinesisch (Jin) Chinesisch (klassische Schriftsprache) Chinesisch (Mandarin) Chinesisch (Minnan) Chinesisch (Schanghai) Chinesisch (Xiang) Chinesisches Pidgin Englisch Chinook Chinyanya (Chichewa) ChiTonga (Sambesi) Choctaw Cuyonon CycL Dänisch Deutsch Dhivehi Drents Dunganisch Dusun (zentral) Duttonsche Weltkurzschrift Emilianisch Englisch Erromintxela Ersjanisch Esperanto Estnisch Ewe Ewenkische Extremadurisch Färöisch Fidschi Fidschi-Hindi Finnisch Französisch Fulfulde (Niger) Furlanisch Ga Gagauz Galizisch Garhwali Georgisch Gotisch Griechisch Groninger Ostfriesisch Grönländisch Grünes Miao Guaraní Gujarati Haida (Nord) Haida (Süd) Hausa Hawaiisch Hebräisch Hebräisch (Alt-) Hiligaynon Hindi Hitchiti Ho Hügelmari Hunsrücker Platt Iban Ido Igbo Ilokano Indonesisch Interglossa Interlingua Interlingue Inuktitut Irisch Isan Ischorisch isiXhosa Isländisch Italienisch Jakutisch Jamaikanische Kreolisch Japanisch Javanisch Jiddisch Juhuri K’iche’ Kabardinisch Kabylisch Kadazan (Küste) Kalmückisch Kambodschanisch Kanaresisch Kantonesisch Kanuri (Zentral-) Kapampangan Karachanidisch Karakalpakisch Karatschai-Balkarisch Karelisch Kasachisch Kaschgaisch Kaschmiri Kaschubisch Katalanisch Kekchí Kelantan-Pattani-Malaiisch Keningau Murut Khasi Kikamba Kirgisisch Kiribatisch Kirundi Klingonisch Kölsch Komi-Permjakisch Komi-Syrjänisch Konkani (Goa) Koreanisch Kornisch Korsisch Kotava Kreolisch (Haiti) Krimtatarisch Kroatisch Kumükisch Kvenisch Láadan Ladinisch Ladino Lakota Laotisch Latein Laz Lettgallisch Lettisch Libysch-Arabisch Ligurisch Limburgisch Lingála Lingua Franca Nova Litauisch Livisch Lojban Lombardisch Louisianakreolisch Luganda Lushootseed Luxemburgisch Maduresisch Mahasu Pahari Maithili Makedonisch Malagasy Malaiisch Malaiisch (Nordmolukken) Malaiisch (vernakulär) Malayalam Maltesisch Mambai Mandschurisch Manx-Gälisch Māori Mapudungun Marathi Marshallesisch Mayathan Meitei Mi’kmaq Minangkabauisch Mingrelisch Mirandés Mittelenglisch Mittelfranzösisch Mittelpersisch (Pahlavi) Mnong (Zentral) Mohawk Mokschanisch Mon Mongolisch Mono (Kalifornien) Morisyen Muskogee (Creek) Naga (Tangshang) Nahuatl Nahuatl (Guerrero) Nahuatl (Orizaba) Nahuatl (Zentralhuasteca) Nande Nauruisch Navajo Nawat Neapolitanisch Nepalesisch Newari Ngeq Niederländisch Niedersorbisch Niueanisch Nogaisch Nordfriesisch Nordkurdisch (Kurmandschi) Nordsamisch Nordzazaisch (Kirmanjki) Norwegisch (Bokmål) Norwegisch (Nynorsk) Novial Nuer Nyungar O'Odham Obersorbisch Ojibwe Okzitanisch Oriya Osmanisches Türkisch Ossetisch Palauisch Pali Pandschabi (östlich) Pandschabi (westlich) Pangasinensisch Papiamento Paschtunisch Pennsylvaniadeutsch Persisch Pfälzisch Phönizisch Picardisch Piemontesisch Plains-Cree Plattdeutsch Polnisch Portugiesisch Pulaar Quechua Quenya Rapanui Rätoromanisch Rendille Rohingya Romani Ruandisch Rumänisch Russisch Ruthenisch Ryūkyū-Sprachen Samoanisch Sango Sanskrit Santali Saraiki Sardinisch Saterfriesisch Schemaitisch Schlesisch (Wasserpolnisch) Schona Schottisches Gälisch Schwäbisch Schwedisch Schweizerdeutsch Scots Secwepemctsín Seeländisch Serbisch Sesotho Setswana Seychellenkreolisch Sindarin Sindhi Singhalesisch Sizilianisch Slowakisch Slowenisch Somali Spanisch Srananisch Suaheli Suaheli (Kongo) Subanen (Süd) Südaltaisch Südkurdisch Südsamisch Südzazaisch (Dimli) Sumerisch Sundanesisch Swazi Sylheti Syriakisch Tacawit Tadschikisch Tagalog Tagol Murut Tahitisch Talisch Talossisch Tamahaq Tamazight Tamilisch Tarifit Taschelhit Tatarisch Telugu Temuanisch Tetun Thai Tibetisch Tigre Tigrinisch Tok Pisin Tokelauisch Toki Pona Tongaisch Tschagataisch Tschechisch Tschetschenisch Tschuktschisch Tschuwaschisch Tsonga Tumbuka Türkisch Turkmenisch Tuvaluisch Tuwinisch Uab Meto Udmurtisch Uigurisch Ukrainisch Umbundu Ungarisch Urdu Urhobo Usbekisch Venezianisch Vietnamesisch Volapük Võro Walisisch Wallonisch Wáray-Wáray Wayuu Weißes Miao Weißrussisch Wepsisch Westarmenisch Westfriesisch Wiesenmari Wolof Yi (Norddialekt) Yoruba Zazaisch Zentralkurdisch (Sorani) Zulu Unbekannte Sprache - Dateibeschreibung
- Enthält alle Sätze in der gewählten Sprache. Jedem Satz ist eine eindeutige Nummer und ein Sprachkürzel gemäß ISO 639-3 zugewiesen.
- Struktur der Ausgabe
- Satznummer [Tabulator] Sprache [Tabulator] Text
Detaillierte Sätze
- Dateiname
-
{{sentencesDetailed | filename}}
Alle Sprachen Nur Sätze in: Abchasisch Adyghe Afrihili Afrikaans Ainu Aklanon Albanisch Albanisch (Gegisch) Alt-Tupí Altenglisch Altfranzösisch Altfriesisch Altgriechisch Altnordisch Altostslawisch Altpreußisch Altsächsisch Altspanisch Alttürkisch Amharisch Antillen-Kreolisch Arabisch Arabisch (Ägypten) Arabisch (Algerien) Arabisch (Golf) Arabisch (Irak) Arabisch (Marokko) Arabisch (nordlevantinisch) Arabisch (Südlevantinisch) Aragonesisch Aramäisch (Alt-) Aramäisch (Assyrisch-Neu-) Aramäisch (jüdisch-babylonisch) Aramäisch (jüdisch-palästinisch) Armenisch (Ost-) Aserbaidschanisch Assamesisch Asturisch Awadhi Awarisch Aymara Bairisch Balinesisch Bambara Banjaresisch Baschkirisch Baskisch Baybayisch Belutschi Bengalisch Berberisch Berom Bhojpuri Bikol (Zentral) Bislama Bodo Bosnisch Bretonisch Brithenig Bulgarisch Burjatisch Burmesisch Cayuga Cebuano Chakassisch Chaladschisch Chamorro Chavacano Cherokee Chinesisch (Gan) Chinesisch (Hakka) Chinesisch (Jin) Chinesisch (klassische Schriftsprache) Chinesisch (Mandarin) Chinesisch (Minnan) Chinesisch (Schanghai) Chinesisch (Xiang) Chinesisches Pidgin Englisch Chinook Chinyanya (Chichewa) ChiTonga (Sambesi) Choctaw Cuyonon CycL Dänisch Deutsch Dhivehi Drents Dunganisch Dusun (zentral) Duttonsche Weltkurzschrift Emilianisch Englisch Erromintxela Ersjanisch Esperanto Estnisch Ewe Ewenkische Extremadurisch Färöisch Fidschi Fidschi-Hindi Finnisch Französisch Fulfulde (Niger) Furlanisch Ga Gagauz Galizisch Garhwali Georgisch Gotisch Griechisch Groninger Ostfriesisch Grönländisch Grünes Miao Guaraní Gujarati Haida (Nord) Haida (Süd) Hausa Hawaiisch Hebräisch Hebräisch (Alt-) Hiligaynon Hindi Hitchiti Ho Hügelmari Hunsrücker Platt Iban Ido Igbo Ilokano Indonesisch Interglossa Interlingua Interlingue Inuktitut Irisch Isan Ischorisch isiXhosa Isländisch Italienisch Jakutisch Jamaikanische Kreolisch Japanisch Javanisch Jiddisch Juhuri K’iche’ Kabardinisch Kabylisch Kadazan (Küste) Kalmückisch Kambodschanisch Kanaresisch Kantonesisch Kanuri (Zentral-) Kapampangan Karachanidisch Karakalpakisch Karatschai-Balkarisch Karelisch Kasachisch Kaschgaisch Kaschmiri Kaschubisch Katalanisch Kekchí Kelantan-Pattani-Malaiisch Keningau Murut Khasi Kikamba Kirgisisch Kiribatisch Kirundi Klingonisch Kölsch Komi-Permjakisch Komi-Syrjänisch Konkani (Goa) Koreanisch Kornisch Korsisch Kotava Kreolisch (Haiti) Krimtatarisch Kroatisch Kumükisch Kvenisch Láadan Ladinisch Ladino Lakota Laotisch Latein Laz Lettgallisch Lettisch Libysch-Arabisch Ligurisch Limburgisch Lingála Lingua Franca Nova Litauisch Livisch Lojban Lombardisch Louisianakreolisch Luganda Lushootseed Luxemburgisch Maduresisch Mahasu Pahari Maithili Makedonisch Malagasy Malaiisch Malaiisch (Nordmolukken) Malaiisch (vernakulär) Malayalam Maltesisch Mambai Mandschurisch Manx-Gälisch Māori Mapudungun Marathi Marshallesisch Mayathan Meitei Mi’kmaq Minangkabauisch Mingrelisch Mirandés Mittelenglisch Mittelfranzösisch Mittelpersisch (Pahlavi) Mnong (Zentral) Mohawk Mokschanisch Mon Mongolisch Mono (Kalifornien) Morisyen Muskogee (Creek) Naga (Tangshang) Nahuatl Nahuatl (Guerrero) Nahuatl (Orizaba) Nahuatl (Zentralhuasteca) Nande Nauruisch Navajo Nawat Neapolitanisch Nepalesisch Newari Ngeq Niederländisch Niedersorbisch Niueanisch Nogaisch Nordfriesisch Nordkurdisch (Kurmandschi) Nordsamisch Nordzazaisch (Kirmanjki) Norwegisch (Bokmål) Norwegisch (Nynorsk) Novial Nuer Nyungar O'Odham Obersorbisch Ojibwe Okzitanisch Oriya Osmanisches Türkisch Ossetisch Palauisch Pali Pandschabi (östlich) Pandschabi (westlich) Pangasinensisch Papiamento Paschtunisch Pennsylvaniadeutsch Persisch Pfälzisch Phönizisch Picardisch Piemontesisch Plains-Cree Plattdeutsch Polnisch Portugiesisch Pulaar Quechua Quenya Rapanui Rätoromanisch Rendille Rohingya Romani Ruandisch Rumänisch Russisch Ruthenisch Ryūkyū-Sprachen Samoanisch Sango Sanskrit Santali Saraiki Sardinisch Saterfriesisch Schemaitisch Schlesisch (Wasserpolnisch) Schona Schottisches Gälisch Schwäbisch Schwedisch Schweizerdeutsch Scots Secwepemctsín Seeländisch Serbisch Sesotho Setswana Seychellenkreolisch Sindarin Sindhi Singhalesisch Sizilianisch Slowakisch Slowenisch Somali Spanisch Srananisch Suaheli Suaheli (Kongo) Subanen (Süd) Südaltaisch Südkurdisch Südsamisch Südzazaisch (Dimli) Sumerisch Sundanesisch Swazi Sylheti Syriakisch Tacawit Tadschikisch Tagalog Tagol Murut Tahitisch Talisch Talossisch Tamahaq Tamazight Tamilisch Tarifit Taschelhit Tatarisch Telugu Temuanisch Tetun Thai Tibetisch Tigre Tigrinisch Tok Pisin Tokelauisch Toki Pona Tongaisch Tschagataisch Tschechisch Tschetschenisch Tschuktschisch Tschuwaschisch Tsonga Tumbuka Türkisch Turkmenisch Tuvaluisch Tuwinisch Uab Meto Udmurtisch Uigurisch Ukrainisch Umbundu Ungarisch Urdu Urhobo Usbekisch Venezianisch Vietnamesisch Volapük Võro Walisisch Wallonisch Wáray-Wáray Wayuu Weißes Miao Weißrussisch Wepsisch Westarmenisch Westfriesisch Wiesenmari Wolof Yi (Norddialekt) Yoruba Zazaisch Zentralkurdisch (Sorani) Zulu Unbekannte Sprache - Dateibeschreibung
- Enthält weitere Felder für jeden Satz (Besitzername, Erstellungs-/Bearbeitungsdatum).
- Struktur der Ausgabe
- Satznummer [Tabulator] Sprache [Tabulator] Text [Tabulator] Benutzername [Tabulator] Hinzugefügt am [Tabulator] Zuletzt bearbeitet am
Original- und als Übersetzung entstandene Sätze
- Dateiname
- sentences_base.tar.bz2
- Dateibeschreibung
-
Jeder Satz ist als Originalsatz oder Übersetzung aufgeführt. Das Grundfeld kann die folgenden Werte haben:
- 0: Originalsatz.
- >0: Nummer des zugrundeliegenden übersetzten Satzes.
- \N: unbekannt (selten)
- Struktur der Ausgabe
- Satznummer [Tabulator] Grundfeld
Sätze (CC0)
- Dateiname
-
Alle Sprachen Nur Sätze in: Altfriesisch Altgriechisch Altnordisch Arabisch Arabisch (Algerien) Aramäisch (Alt-) Aramäisch (jüdisch-babylonisch) Aramäisch (jüdisch-palästinisch) Bengalisch Berberisch Chinesisch (klassische Schriftsprache) Chinesisch (Mandarin) Dänisch Deutsch Englisch Esperanto Finnisch Französisch Hebräisch Hebräisch (Alt-) Hindi Ho Ido Interlingua Italienisch Japanisch Jiddisch Kabylisch Kantonesisch Karelisch Katalanisch Klingonisch Kvenisch Láadan Ladino Latein Ligurisch Mittelenglisch Niederländisch Norwegisch (Bokmål) Nyungar Phönizisch Polnisch Portugiesisch Russisch Santali Schwedisch Spanisch Sylheti Tacawit Tamazight Toki Pona Tschechisch Ukrainisch Ungarisch Volapük Walisisch Weißrussisch Unbekannte Sprache - Dateibeschreibung
- Enthalten: alle unter der Lizenz CC0 verfügbaren Sätze.
- Struktur der Ausgabe
- Satznummer [Tabulator] Sprache [Tabulator] Text [Tabulator] Zuletzt bearbeitet am
Verknüpfungen
- Dateiname
- links.tar.bz2
- Dateibeschreibung
- Beinhaltet die Satzverknüpfungen. 1 [Tabulator] 77 bedeutet, dass Satz Nr. 77 die Übersetzung des Satzes Nr. 1 ist. Die umgekehrte Verknüpfung ist ebenfalls vorhanden. Die Datei enthält also auch den Eintrag 77 [Tabulator] 1.
- Struktur der Ausgabe
- Satznummer [Tabulator] Übersetzungsnummer
Etiketten
- Dateiname
- tags.tar.bz2
- Dateibeschreibung
- Enthält die Liste der einem Satz hinzugefügten Etiketten. „381279 [Tabulator] proverb“ bedeutet, dass Satz Nr. 381279 mit dem Etikett „proverb“ (Sprichwort) versehen ist.
- Struktur der Ausgabe
- Satznummer [Tabulator] Bezeichnung des Etiketts
Listen
- Dateiname
- user_lists.tar.bz2
- Dateibeschreibung
- Enthält die Liste aller Satzlisten.
- Struktur der Ausgabe
- Listennummer [Tabulator] Benutzername [Tabulator] Erstellt am [Tabulator] Zuletzt bearbeitet am [Tabulator] Listenbezeichnung [Tabulator] Bearbeitungsrechte
In Listen enthaltene Sätze
- Dateiname
- sentences_in_lists.tar.bz2
- Dateibeschreibung
- Zeigt an, dass die Sätze in einer Liste sind. 13 [Tabulator] 381279 bedeutet, dass Satz Nr. 381279 in der Liste mit ID-Nr. 13 ist.
- Struktur der Ausgabe
- Listennummer [Tabulator] Satznummer
Japanischer Index
- Dateiname
- jpn_indices.tar.bz2
- Dateibeschreibung
- Beinhaltet das Äquivalent der "B-Linien" in der Tanaka-Korpusdatei von Jim Breen. Siehe this page für das Format. Jeder Eintrag entspricht einem englisch-japanischen Satzpaar. Satznummer ist die Nummer des japanischen Satzes, Übersetzungsnummer diejenige des englischen.
- Struktur der Ausgabe
- Satznummer [Tabulator] Übersetzungsnummer [Tabulator] Text
Sätze mit Audio
- Dateiname
- sentences_with_audio.tar.bz2
- Dateibeschreibung
- Enthält die Nummern sämtlicher vertonter Sätze. Die anderen Felder geben den Urheber der Vertonung, deren Lizenz sowie eine Adresse zur Namensnennung an. Ist keine Lizenz angegeben, so darf die Vertonung außerhalb von Tatoeba nicht verwendet werden.
- Aufnahme herunterladen
- Jeder Satz kann mit mehreren Aufnahmen versehen werden. Die Adresse, über die sich eine bestimmte davon herunterladen lässt, kann man mit Hilfe der zugehörigen Nummer bilden. Für Aufnahme Nr. 1234 ist dies beispielsweise https://tatoeba.org/audio/download/1234.
- Struktur der Ausgabe
- Satznummer [Tabulator] Aufnahme Nr. [Tabulator] Benutzername [Tabulator] Lizenz [Tabulator] Urheberprofil
Benutzerqualifikationsniveau pro Sprache
- Dateiname
- user_languages.tar.bz2
- Dateibeschreibung
- Zeigt das selbstberichtete Qualifikationsniveau der Mitglieder in einzelnen Sprachen.
- Struktur der Ausgabe
- Sprache [Tabulator] Qualifikationsniveau [Tabulator] Benutzername [Tabulator] Details
Bewertete Sätze
- Dateiname
- users_sentences.csv
- Dateibeschreibung
- Enthalten sind von Mitarbeitern bewertete Sätze. Dabei gibt es folgende Werte: -1 (der Satz ist fehlerhaft), 0 (der Satz ist zweifelhaft), 1 (der Satz ist gut). Warnung: Diese Dateiausgabe befindet sich noch im Entwicklungsstadium.
- Struktur der Ausgabe
- Benutzername [Tabulator] Satznummer [Tabulator] Beurteilung [Tabulator] Hinzugefügt am [Tabulator] Zuletzt bearbeitet am
Transkriptionen
- Dateiname
-
Alle Sprachen Nur Sätze in: Chinesisch (Mandarin) Japanisch Kantonesisch Usbekisch - Dateibeschreibung
- Enthält alle Transkriptionen in Hilfs- oder alternativen Schriftsystemen. Benutzernamen weisen darauf hin, wer eine Transkription als letzter verifiziert und möglicherweise bearbeitet hat. Wenn kein Benutzername dabeisteht, ist die Transkription noch von niemandem verifiziert worden. Die Schriftsysteme werden gemäß ISO 15924 bezeichnet.
- Struktur der Ausgabe
- Satznummer [Tabulator] Sprache [Tabulator] Schriftsystem [Tabulator] Benutzername [Tabulator] Transkription