clear
{{language.name}} Keine Sprache gefunden.
swap_horiz
{{language.name}} Keine Sprache gefunden.
search

Hinweis

Die hier bereitgestellten Dateien sind nur zum Programmieren und zur Datenverarbeitung von Nutzen.

Wenn du an Sätzen zum Lernen interessiert bist, könnte sich ein Blick auf die Satzlisten lohnen. Du kannst eigene erstellen oder diejenigen anderer betrachten. Die Listen können heruntergeladen und ausgedruckt werden.

Allgemeine Informationen

Die hier zur Verfügung gestellten Dateien werden jeden Samstag um 6.30 Uhr koordinierter Weltzeit aktualisiert.

Viele der japanischen und englischen Sätze gehören zum gemeinfreien Tanaka-Korpus.

Creative Commons

Diese Dateien stehen unter der Lizenz CC BY 2.0 FR zur Verfügung.

Creative Commons License CC-BY

Ein Teil der Sätze steht auch unter der Lizenz CC0 1.0 zur Verfügung.

Creative Commons License CC0

Lizenzen der Audiobeiträge

Die Wahl der Lizenz, unter welcher eine Audiodatei zur Verfügung gestellt wird, obliegt dem Urheber; sie kann auf der Seite seiner sämtlichen Audiobeiträge eingesehen werden.

Fragen?

Bei Fragen oder Anliegen nimm gerne Kontakt mit uns auf! Wir antworten in der Regel schnell.

Zum Herunterladen

Sätze

Dateiname

{{sentences | filename}}

Alle Sprachen
Nur Sätze in: Abchasisch Adyghe Afrihili Afrikaans Ainu Aklanon Albanisch Albanisch (Gegisch) Alt-Tupí Altenglisch Altfranzösisch Altgriechisch Altnordisch Altostslawisch Altpreußisch Altsächsisch Altspanisch Alttürkisch Amharisch Antillen-Kreolisch Arabisch Arabisch (Ägypten) Arabisch (Algerien) Arabisch (Golf) Arabisch (Irak) Arabisch (Marokko) Arabisch (nordlevantinisch) Aragonesisch Aramäisch (Alt-) Aramäisch (Assyrisch-Neu-) Aramäisch (jüdisch-babylonisch) Aramäisch (jüdisch-palästinisch) Armenisch Aserbaidschanisch Assamesisch Asturisch Awadhi Aymara Bairisch Balinesisch Bambara Banjaresisch Baschkirisch Baskisch Baybayisch Bengalisch Bhojpuri Bikol (Zentral) Bislama Bodo Bosnisch Bretonisch Brithenig Bulgarisch Burjatisch Burmesisch Cayuga Cebuano Chakassisch Chamorro Chavacano Cherokee Chinesisch (Gan) Chinesisch (Hakka) Chinesisch (Jin) Chinesisch (klassische Schriftsprache) Chinesisch (Mandarin) Chinesisch (Minnan) Chinesisch (Schanghai) Chinesisch (Xiang) Chinesisches Pidgin Englisch Chinyanya (Chichewa) ChiTonga (Sambesi) Choctaw Cuyonon CycL Dänisch Deutsch Dhivehi Drents Dunganisch Dusun (zentral) Duttonsche Weltkurzschrift Emilianisch Englisch Erromintxela Ersjanisch Esperanto Estnisch Ewe Ewenkische Extremadurisch Färöisch Fidschi Fidschi-Hindi Finnisch Französisch Fulfulde (Niger) Furlanisch Ga Gagauz Galizisch Garhwali Georgisch Gotisch Griechisch Groninger Ostfriesisch Grönländisch Grünes Miao Guaraní Gujarati Hausa Hawaiisch Hebräisch Hiligaynon Hindi Ho Hügelmari Hunsrücker Platt Iban Ido Igbo Ilokano Indonesisch Interlingua Interlingue Inuktitut Irisch Isan Ischorisch isiXhosa Isländisch Italienisch Jakutisch Jamaikanische Kreolisch Japanisch Javanisch Jiddisch Juhuri K’iche’ Kabylisch Kadazan (Küste) Kalmückisch Kambodschanisch Kanaresisch Kantonesisch Kapampangan Karakalpakisch Karatschai-Balkarisch Karelisch Kasachisch Kaschmiri Kaschubisch Katalanisch Kekchí Keningau Murut Khasi Kikamba Kirgisisch Kiribatisch Kirundi Klingonisch Kölsch Komi-Permjakisch Komi-Syrjänisch Konkani (Goa) Koreanisch Kornisch Korsisch Kotava Kreolisch (Haiti) Krimtatarisch Kroatisch Kumükisch Kurdisch Kvenisch Láadan Ladinisch Ladino Lakota Laotisch Latein Laz Lettgallisch Lettisch Ligurisch Lingála Lingua Franca Nova Litauisch Livisch Lojban Lombardisch Louisianakreolisch Luganda Luxemburgisch Maduresisch Maithili Makedonisch Malagasy Malaiisch Malaiisch (Nordmolukken) Malaiisch (vernakulär) Malayalam Maltesisch Mambai Mandschurisch Manx-Gälisch Māori Marathi Marshallesisch Mi’kmaq Minangkabauisch Mingrelisch Mirandés Mittelenglisch Mittelfranzösisch Mnong (Zentral) Mohawk Mokschanisch Mon Mongolisch Morisyen Naga (Tangshang) Nahuatl Nahuatl (Guerrero) Nahuatl (Orizaba) Nahuatl (Zentralhuasteca) Nauruisch Navajo Nawat Nepalesisch Newari Ngeq Niederländisch Niedersorbisch Niueanisch Nogaisch Nordfriesisch Nordsamisch Norwegisch (Bokmål) Norwegisch (Nynorsk) Novial Nyungar Obersorbisch Ojibwe Okzitanisch Oriya Osmanisches Türkisch Ossetisch Palauisch Pandschabi (östlich) Pandschabi (westlich) Pangasinensisch Papiamento Paschtunisch Pennsylvaniadeutsch Persisch Pfälzisch Phönizisch Picardisch Piemontesisch Plattdeutsch Polnisch Portugiesisch Pulaar Quechua Quenya Rapanui Rätoromanisch Rendille Romani Ruandisch Rumänisch Russisch Ruthenisch Ryūkyū-Sprachen Samoanisch Sango Sanskrit Sardinisch Saterfriesisch Schemaitisch Schona Schottisches Gälisch Schwäbisch Schwedisch Schweizerdeutsch Scots Secwepemctsín Serbisch Sesotho Setswana Seychellenkreolisch Sindarin Sindhi Singhalesisch Sizilianisch Slowakisch Slowenisch Somali Spanisch Suaheli Südsamisch Sumerisch Sundanesisch Swazi Syriakisch Tacawit Tadschikisch Tagalog Tagol Murut Tahitisch Talisch Talossisch Tamahaq Tamazight Tamilisch Tarifit Tatarisch Telugu Temuanisch Tetun Thai Tibetisch Tigre Tigrinisch Tok Pisin Tokelauisch Toki Pona Tongaisch Tschagataisch Tschechisch Tschetschenisch Tschuktschisch Tschuwaschisch Tsonga Türkisch Turkmenisch Tuvaluisch Tuwinisch Uab Meto Udmurtisch Uigurisch Ukrainisch Umbundu Ungarisch Urdu Urhobo Usbekisch Venezianisch Vietnamesisch Volapük Võro Walisisch Wallonisch Wáray-Wáray Weißes Miao Weißrussisch Wepsisch Westfriesisch Wiesenmari Wolof Yi (Norddialekt) Yoruba Zazaisch Zulu Unbekannte Sprache
Dateibeschreibung
Enthält alle Sätze in der gewählten Sprache. Jedem Satz ist eine eindeutige Nummer und ein Sprachkürzel gemäß ISO 639-3 zugewiesen.
Struktur der Ausgabe
Satznummer [Tabulator] Sprache [Tabulator] Text

Detaillierte Sätze

Dateiname

{{sentencesDetailed | filename}}

Alle Sprachen
Nur Sätze in: Abchasisch Adyghe Afrihili Afrikaans Ainu Aklanon Albanisch Albanisch (Gegisch) Alt-Tupí Altenglisch Altfranzösisch Altgriechisch Altnordisch Altostslawisch Altpreußisch Altsächsisch Altspanisch Alttürkisch Amharisch Antillen-Kreolisch Arabisch Arabisch (Ägypten) Arabisch (Algerien) Arabisch (Golf) Arabisch (Irak) Arabisch (Marokko) Arabisch (nordlevantinisch) Aragonesisch Aramäisch (Alt-) Aramäisch (Assyrisch-Neu-) Aramäisch (jüdisch-babylonisch) Aramäisch (jüdisch-palästinisch) Armenisch Aserbaidschanisch Assamesisch Asturisch Awadhi Aymara Bairisch Balinesisch Bambara Banjaresisch Baschkirisch Baskisch Baybayisch Bengalisch Bhojpuri Bikol (Zentral) Bislama Bodo Bosnisch Bretonisch Brithenig Bulgarisch Burjatisch Burmesisch Cayuga Cebuano Chakassisch Chamorro Chavacano Cherokee Chinesisch (Gan) Chinesisch (Hakka) Chinesisch (Jin) Chinesisch (klassische Schriftsprache) Chinesisch (Mandarin) Chinesisch (Minnan) Chinesisch (Schanghai) Chinesisch (Xiang) Chinesisches Pidgin Englisch Chinyanya (Chichewa) ChiTonga (Sambesi) Choctaw Cuyonon CycL Dänisch Deutsch Dhivehi Drents Dunganisch Dusun (zentral) Duttonsche Weltkurzschrift Emilianisch Englisch Erromintxela Ersjanisch Esperanto Estnisch Ewe Ewenkische Extremadurisch Färöisch Fidschi Fidschi-Hindi Finnisch Französisch Fulfulde (Niger) Furlanisch Ga Gagauz Galizisch Garhwali Georgisch Gotisch Griechisch Groninger Ostfriesisch Grönländisch Grünes Miao Guaraní Gujarati Hausa Hawaiisch Hebräisch Hiligaynon Hindi Ho Hügelmari Hunsrücker Platt Iban Ido Igbo Ilokano Indonesisch Interlingua Interlingue Inuktitut Irisch Isan Ischorisch isiXhosa Isländisch Italienisch Jakutisch Jamaikanische Kreolisch Japanisch Javanisch Jiddisch Juhuri K’iche’ Kabylisch Kadazan (Küste) Kalmückisch Kambodschanisch Kanaresisch Kantonesisch Kapampangan Karakalpakisch Karatschai-Balkarisch Karelisch Kasachisch Kaschmiri Kaschubisch Katalanisch Kekchí Keningau Murut Khasi Kikamba Kirgisisch Kiribatisch Kirundi Klingonisch Kölsch Komi-Permjakisch Komi-Syrjänisch Konkani (Goa) Koreanisch Kornisch Korsisch Kotava Kreolisch (Haiti) Krimtatarisch Kroatisch Kumükisch Kurdisch Kvenisch Láadan Ladinisch Ladino Lakota Laotisch Latein Laz Lettgallisch Lettisch Ligurisch Lingála Lingua Franca Nova Litauisch Livisch Lojban Lombardisch Louisianakreolisch Luganda Luxemburgisch Maduresisch Maithili Makedonisch Malagasy Malaiisch Malaiisch (Nordmolukken) Malaiisch (vernakulär) Malayalam Maltesisch Mambai Mandschurisch Manx-Gälisch Māori Marathi Marshallesisch Mi’kmaq Minangkabauisch Mingrelisch Mirandés Mittelenglisch Mittelfranzösisch Mnong (Zentral) Mohawk Mokschanisch Mon Mongolisch Morisyen Naga (Tangshang) Nahuatl Nahuatl (Guerrero) Nahuatl (Orizaba) Nahuatl (Zentralhuasteca) Nauruisch Navajo Nawat Nepalesisch Newari Ngeq Niederländisch Niedersorbisch Niueanisch Nogaisch Nordfriesisch Nordsamisch Norwegisch (Bokmål) Norwegisch (Nynorsk) Novial Nyungar Obersorbisch Ojibwe Okzitanisch Oriya Osmanisches Türkisch Ossetisch Palauisch Pandschabi (östlich) Pandschabi (westlich) Pangasinensisch Papiamento Paschtunisch Pennsylvaniadeutsch Persisch Pfälzisch Phönizisch Picardisch Piemontesisch Plattdeutsch Polnisch Portugiesisch Pulaar Quechua Quenya Rapanui Rätoromanisch Rendille Romani Ruandisch Rumänisch Russisch Ruthenisch Ryūkyū-Sprachen Samoanisch Sango Sanskrit Sardinisch Saterfriesisch Schemaitisch Schona Schottisches Gälisch Schwäbisch Schwedisch Schweizerdeutsch Scots Secwepemctsín Serbisch Sesotho Setswana Seychellenkreolisch Sindarin Sindhi Singhalesisch Sizilianisch Slowakisch Slowenisch Somali Spanisch Suaheli Südsamisch Sumerisch Sundanesisch Swazi Syriakisch Tacawit Tadschikisch Tagalog Tagol Murut Tahitisch Talisch Talossisch Tamahaq Tamazight Tamilisch Tarifit Tatarisch Telugu Temuanisch Tetun Thai Tibetisch Tigre Tigrinisch Tok Pisin Tokelauisch Toki Pona Tongaisch Tschagataisch Tschechisch Tschetschenisch Tschuktschisch Tschuwaschisch Tsonga Türkisch Turkmenisch Tuvaluisch Tuwinisch Uab Meto Udmurtisch Uigurisch Ukrainisch Umbundu Ungarisch Urdu Urhobo Usbekisch Venezianisch Vietnamesisch Volapük Võro Walisisch Wallonisch Wáray-Wáray Weißes Miao Weißrussisch Wepsisch Westfriesisch Wiesenmari Wolof Yi (Norddialekt) Yoruba Zazaisch Zulu Unbekannte Sprache
Dateibeschreibung
Enthält weitere Felder für jeden Satz (Besitzername, Erstellungs-/Bearbeitungsdatum).
Struktur der Ausgabe
Satznummer [Tabulator] Sprache [Tabulator] Text [Tabulator] Benutzername [Tabulator] Hinzugefügt am [Tabulator] Zuletzt bearbeitet am

Base of Sentences

Dateiname
sentences_base.tar.bz2
Dateibeschreibung
A sentence is based on another if it has been initially added as a translation. Each sentence is associated with a base, which can be:
  • zero: The sentence is original, not based on another.
  • greater than 0: The sentence id it is based upon.
  • \N: We do not know. This is rare but we have a handful of sentences for which we do not know if they have been added as translations or not.
Struktur der Ausgabe
Satznummer [Tabulator] Base of the sentence

Sätze (CC0)

Dateiname

{{sentencesCC0 | filename}}

Alle Sprachen
Nur Sätze in: Arabisch Arabisch (Ägypten) Arabisch (nordlevantinisch) Aramäisch (Alt-) Aramäisch (jüdisch-babylonisch) Brithenig Chinesisch (klassische Schriftsprache) Dänisch Deutsch Englisch Esperanto Finnisch Französisch Hebräisch Ido Interlingua Interlingue Ischorisch Isländisch Italienisch Jiddisch Kabylisch Kantonesisch Karelisch Katalanisch Klingonisch Kvenisch Ladino Latein Ligurisch Lingua Franca Nova Lojban Mittelenglisch Niederländisch Norwegisch (Bokmål) Novial Nyungar Phönizisch Polnisch Portugiesisch Russisch Sindarin Spanisch Tacawit Talossisch Tamazight Toki Pona Tschechisch Türkisch Ukrainisch Ungarisch Volapük Weißrussisch Unbekannte Sprache
Dateibeschreibung
Enthalten: alle unter der Lizenz CC0 verfügbaren Sätze.
Struktur der Ausgabe
Satznummer [Tabulator] Sprache [Tabulator] Text [Tabulator] Zuletzt bearbeitet am

Verknüpfungen

Dateiname
links.tar.bz2
Dateibeschreibung
Beinhaltet die Satzverknüpfungen. 1 [Tabulator] 77 bedeutet, dass Satz Nr. 77 die Übersetzung des Satzes Nr. 1 ist. Die umgekehrte Verknüpfung ist ebenfalls vorhanden. Die Datei enthält also auch den Eintrag 77 [Tabulator] 1.
Struktur der Ausgabe
Satznummer [Tabulator] Übersetzungsnummer

Etiketten

Dateiname
tags.tar.bz2
Dateibeschreibung
Enthält die Liste der einem Satz hinzugefügten Etiketten. „381279 [Tabulator] proverb“ bedeutet, dass Satz Nr. 381279 mit dem Etikett „proverb“ (Sprichwort) versehen ist.
Struktur der Ausgabe
Satznummer [Tabulator] Bezeichnung des Etiketts

Listen

Dateiname
user_lists.tar.bz2
Dateibeschreibung
Enthält die Liste aller Satzlisten.
Struktur der Ausgabe
Listennummer [Tabulator] Benutzername [Tabulator] Erstellt am [Tabulator] Zuletzt bearbeitet am [Tabulator] Listenbezeichnung [Tabulator] Bearbeitungsrechte

In Listen enthaltene Sätze

Dateiname
sentences_in_lists.tar.bz2
Dateibeschreibung
Zeigt an, dass die Sätze in einer Liste sind. 13 [Tabulator] 381279 bedeutet, dass Satz Nr. 381279 in der Liste mit ID-Nr. 13 ist.
Struktur der Ausgabe
Listennummer [Tabulator] Satznummer

Japanischer Index

Dateiname
jpn_indices.tar.bz2
Dateibeschreibung
Beinhaltet das Äquivalent der "B-Linien" in der Tanaka-Korpusdatei von Jim Breen. Siehe this page für das Format. Jeder Eintrag entspricht einem englisch-japanischen Satzpaar. Satznummer ist die Nummer des japanischen Satzes, Übersetzungsnummer diejenige des englischen.
Struktur der Ausgabe
Satznummer [Tabulator] Übersetzungsnummer [Tabulator] Text

Sätze mit Audio

Dateiname
sentences_with_audio.tar.bz2
Dateibeschreibung
Enthält die Nummern sämtlicher vertonter Sätze. Die anderen Felder geben den Urheber der Vertonung, deren Lizenz sowie eine Adresse zur Namensnennung an. Ist keine Lizenz angegeben, so darf die Vertonung außerhalb von Tatoeba nicht verwendet werden.
Struktur der Ausgabe
Satznummer [Tabulator] Benutzername [Tabulator] Lizenz [Tabulator] Urheberprofil

Benutzerqualifikationsniveau pro Sprache

Dateiname
user_languages.tar.bz2
Dateibeschreibung
Zeigt das selbstberichtete Qualifikationsniveau der Mitglieder in einzelnen Sprachen.
Struktur der Ausgabe
Sprache [Tabulator] Qualifikationsniveau [Tabulator] Benutzername [Tabulator] Details

Bewertete Sätze

Dateiname
users_sentences.csv
Dateibeschreibung
Enthalten sind von Mitarbeitern bewertete Sätze. Dabei gibt es folgende Werte: -1 (der Satz ist fehlerhaft), 0 (der Satz ist zweifelhaft), 1 (der Satz ist gut). Warnung: Diese Dateiausgabe befindet sich noch im Entwicklungsstadium.
Struktur der Ausgabe
Benutzername [Tabulator] Sprache [Tabulator] Satznummer [Tabulator] Beurteilung [Tabulator] Hinzugefügt am [Tabulator] Zuletzt bearbeitet am

Transkriptionen

Dateiname

{{transcriptions | filename}}

Alle Sprachen
Nur Sätze in: Chinesisch (Mandarin) Japanisch Kantonesisch Usbekisch
Dateibeschreibung
Enthält alle Transkriptionen in Hilfs- oder alternativen Schriftsystemen. Benutzernamen weisen darauf hin, wer eine Transkription als letzter verifiziert und möglicherweise bearbeitet hat. Wenn kein Benutzername dabeisteht, ist die Transkription noch von niemandem verifiziert worden. Die Schriftsysteme werden gemäß ISO 15924 bezeichnet.
Struktur der Ausgabe
Satznummer [Tabulator] Sprache [Tabulator] Schriftsystem [Tabulator] Benutzername [Tabulator] Transkription