Ghi chú

Dữ liệu bạn tìm thấy ở đây sẽ KHÔNG hữu ích trừ khi bạn đang lập trình một công cụ ngôn ngữ hoặc đang xử lý dữ liệu.

Nếu bạn chỉ cần những câu mà bạn có thể dùng để học một ngôn ngữ, hãy xem danh sách sentence. Bạn có thể tạo cho riêng mình hoặc xem những thứ mà người khác tạo ra. Danh sách có thể được tải xuống và in.

Thông tin chung về các tệp

Nhiều câu tiếng Nhật và tiếng Anh có nguồn gốc từ Tanaka Corpus, thuộc phạm vi công cộng.

Creative commons

Các tệp này được phát hành theo CC BY 2.0 FR.

Một phần các câu của chúng tôi cũng có sẵn theo CC0 1.0.

Giấy phép bao gồm âm thanh

Giấy phép bao gồm một tệp âm thanh do người đóng góp chọn và được biểu thị trên trang liệt kê các tệp âm thanh mà người đó đã đóng góp.

Thắc mắc?

Nếu bạn có câu hỏi hoặc yêu cầu, vui lòng liên hệ với chúng tôi. Thông thường, chúng tôi trả lời rất nhanh.

Tải xuống

Sử dụng công cụ này để tạo và tải xuống các bản xuất tùy chỉnh theo ý muốn.

translate

Các cặp câu

Tải xuống tất cả câu bằng ngôn ngữ A với bản dịch bằng ngôn ngữ B

Tải xuống tất cả câu bằng ngôn ngữ A được dịch sang ngôn ngữ B, cùng với bản dịch.

Ngôn ngữ câu:

Ngôn ngữ dịch:

info Các tệp bên dưới được cập nhật vào thứ Bảy hàng tuần lúc 6:30 sáng (UTC).

Câu

Tên tệp: {{sentences | filename}}
Tất cả ngôn ngữ
Chỉ các câu trong: Abaza Ancient Hebrew Ao Naga Baybayanon Berber Berom Biệt ngữ Chinook Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Babylonian Aramaic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Lezgi Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nhóm ngôn ngữ Aklanon Nigerian Fulfulde North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Spanish Old Turkish Orizaba Nahuatl Pipil Pulaar Punjabi (Eastern) Punjabi (Western) Quenya Rendille Setswana Seychellois Creole Shuswap Sindarin South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Svan Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập Levant Tiếng Ả Rập Libya Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Armenia Tây Tiếng Assam Tiếng Assyria Tiếng Asturias tiếng Avar Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Baluchi Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria tiếng Bắc Frisia Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bislama Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon Tiếng Dargwa tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Đức Swabia Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Evenk Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi tiếng Frisia Saterland Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haida Tiếng Haida miền Nam Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Isan Tiếng Java Tiếng Kabardian Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khakas Tiếng Khalaj Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kurd Miền Nam Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Laz Tiếng Liguria Tiếng Limburg Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Lô Lô tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Mapuche Tiếng Marathi tiếng Mari Đông tiếng Mari Tây Tiếng Marshall Tiếng Maya Yucatán Tiếng Meitei Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ Tiếng Napoli tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Newari Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Nuer Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pali Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phoenicia Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Plains Cree Tiếng Qashqai Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Rohingya Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sakha Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Santali Tiếng Saraiki Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shilha Tiếng Shona Tiếng Sicilia tiếng Silesia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sranan Tongo Tiếng Sudan Tiếng Sumeria Tiếng Swahili Tiếng Swahili Congo tiếng Swazi Tiếng Sylhet Tiếng Syriac Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talossa Tiếng Talysh Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tấn Tiếng Tây Ban Nha Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Tumbuka Tiếng Turkmen Tiếng Tuvalu Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza tiếng Zeeland Tiếng Zulu Toki Pona Tonga (Zambezi) Tupinambá Uab Meto Urhobo Wayuu West-Central Oromo Ngôn ngữ chưa rõ
Mô tả tập tin: Chứa tất cả các câu bằng ngôn ngữ đã chọn. Mỗi câu được liên kết với một id duy nhất và mã ngôn ngữ ISO 639-3.
Trường và cấu trúc: Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản

Câu chi tiết

Tên tệp: {{sentencesDetailed | filename}}
Tất cả ngôn ngữ
Chỉ các câu trong: Abaza Ancient Hebrew Ao Naga Baybayanon Berber Berom Biệt ngữ Chinook Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Babylonian Aramaic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Lezgi Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nhóm ngôn ngữ Aklanon Nigerian Fulfulde North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Spanish Old Turkish Orizaba Nahuatl Pipil Pulaar Punjabi (Eastern) Punjabi (Western) Quenya Rendille Setswana Seychellois Creole Shuswap Sindarin South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Svan Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập Levant Tiếng Ả Rập Libya Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Armenia Tây Tiếng Assam Tiếng Assyria Tiếng Asturias tiếng Avar Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Baluchi Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria tiếng Bắc Frisia Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bislama Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon Tiếng Dargwa tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Đức Swabia Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Evenk Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi tiếng Frisia Saterland Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haida Tiếng Haida miền Nam Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Isan Tiếng Java Tiếng Kabardian Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khakas Tiếng Khalaj Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kurd Miền Nam Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Laz Tiếng Liguria Tiếng Limburg Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Lô Lô tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Mapuche Tiếng Marathi tiếng Mari Đông tiếng Mari Tây Tiếng Marshall Tiếng Maya Yucatán Tiếng Meitei Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ Tiếng Napoli tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Newari Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Nuer Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pali Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phoenicia Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Plains Cree Tiếng Qashqai Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Rohingya Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sakha Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Santali Tiếng Saraiki Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shilha Tiếng Shona Tiếng Sicilia tiếng Silesia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sranan Tongo Tiếng Sudan Tiếng Sumeria Tiếng Swahili Tiếng Swahili Congo tiếng Swazi Tiếng Sylhet Tiếng Syriac Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talossa Tiếng Talysh Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tấn Tiếng Tây Ban Nha Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Tumbuka Tiếng Turkmen Tiếng Tuvalu Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza tiếng Zeeland Tiếng Zulu Toki Pona Tonga (Zambezi) Tupinambá Uab Meto Urhobo Wayuu West-Central Oromo Ngôn ngữ chưa rõ
Mô tả tập tin: Chứa các trường bổ sung cho mỗi câu (tên chủ sở hữu, ngày tạo/sửa đổi).
Trường và cấu trúc: Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Tên người dùng [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối

Câu gốc và câu đã dịch

Tên tệp

sentences_base.tar.bz2

Mô tả tập tin

Mỗi câu được liệt kê là bản gốc hoặc bản dịch từ nơi khác. Trường "cơ sở" có thể có các giá trị sau:

zero: Câu là bản gốc, không phải bản dịch từ nơi khác.
lớn hơn 0: Id của câu gốc (mà các bản dịch khác dựa vào nó).
\N: Không xác định (hiếm).

Trường và cấu trúc

Id câu [thẻ] Trường cơ sở (base field)

Câu (CC0)

Tên tệp: {{sentencesCC0 | filename}}
Tất cả ngôn ngữ
Chỉ các câu trong: Ancient Hebrew Berber Jewish Babylonian Aramaic Jewish Palestinian Aramaic Konkani (Goan) Kven Finnish Láadan Nyungar Odia (Oriya) Old Aramaic Old Frisian Tachawit Tiếng Ả rập Tiếng Algeria Ả rập Tiếng Anh Tiếng Anh Trung cổ Tiếng Ba Lan Tiếng Belarussia Tiếng Bengal Tiếng Bồ Đảo Nha Tiếng Catalan Tiếng Do Thái Tiếng Đan Mạch Tiếng Đức Tiếng Esperanto Tiếng Hà Lan Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp cổ Tiếng Ido Tiếng Interlingue Tiếng Kabyle Tiếng Karelian Tiếng Khoa Học Quốc Tế Tiếng Klingon Tiếng La tinh Tiếng Ladino Tiếng Liguria Tiếng Na Uy (Bokmål) Tiếng Na Uy cổ Tiếng Nga Tiếng Nhật Tiếng Pháp Tiếng Phần Lan Tiếng Phoenicia Tiếng Quảng Đông Tiếng Santali Tiếng Séc Tiếng Sylhet Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tây Ban Nha Tiếng Thụy Điển Tiếng Trung Tiếng Trung cổ điển Tiếng Ukraine Tiếng Volapük Tiếng Wales Tiếng Ý Tiếng Yiddish Toki Pona Ngôn ngữ chưa rõ
Mô tả tập tin: Chứa tất cả các câu có sẵn trong CC0.
Trường và cấu trúc: Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Ngày sửa đổi lần cuối

Liên kết

Tên tệp: links.tar.bz2
Mô tả tập tin: Chứa các liên kết giữa các câu. 1 [thẻ] 77 có nghĩa là câu #77 là bản dịch của câu #1. Liên kết đối ứng cũng tồn tại, vì vậy tệp cũng sẽ chứa một dòng chỉ rõ 77 [thẻ] 1.
Trường và cấu trúc: Id câu [thẻ] Id bản dịch

Thẻ

Tên tệp: tags.tar.bz2
Mô tả tập tin: Chứa danh sách thẻ được liên kết với mỗi câu. 381279 [thẻ] proverb có nghĩa là câu #381279 đã được gán thẻ "tục ngữ".
Trường và cấu trúc: Id câu [thẻ] Tag tên

Danh sách

Tên tệp: user_lists.tar.bz2
Mô tả tập tin: Chứa danh sách danh sách câu.
Trường và cấu trúc: Id danh sách [thẻ] Tên người dùng [thẻ] Ngày tạo [thẻ] Ngày sửa đổi lần cuối [thẻ] Tên danh sách [thẻ] Có thể chỉnh sửa bởi

Câu trong danh sách

Tên tệp: sentences_in_lists.tar.bz2
Mô tả tập tin: Cho biết các câu được chứa trong bất kỳ danh sách nào. 13 [thẻ] 381279 có nghĩa là câu #381279 được chứa trong danh sách có id là 13.
Trường và cấu trúc: Id danh sách [thẻ] Id câu

Chỉ số Nhật Bản

Tên tệp: jpn_indices.tar.bz2
Mô tả tập tin: Chứa nội dung tương đương với "dòng B" trong tệp Tanaka Corpus được phân phối bởi Jim Breen. Xem trang này để biết định dạng. Mỗi mục nhập được liên kết với một cặp câu tiếng Nhật/Anh. Id câu đề cập đến id của câu tiếng Nhật. Id nghĩa đề cập đến id của câu tiếng Anh.
Trường và cấu trúc: Id câu [thẻ] Id nghĩa [thẻ] Văn bản

Các câu có âm thanh

Tên tệp: sentences_with_audio.tar.bz2
Mô tả tập tin: Chứa id của các câu, bằng mọi ngôn ngữ, đã có sẵn âm thanh. Các trường khác cho biết ai đã tạo âm thanh, giấy phép của nó và URL để gán tác giả. Nếu trường cấp phép trống, bạn không thể sử dụng lại âm thanh bên ngoài dự án Tatoeba.
Downloading audio: A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
Trường và cấu trúc: Id câu [thẻ] Audio id [thẻ] Tên người dùng [thẻ] Giấy phép [thẻ] URL phân bổ

Cấp độ kỹ năng của người dùng cho mỗi ngôn ngữ

Tên tệp: user_languages.tar.bz2
Mô tả tập tin: Cho thấy cấp độ kỹ năng tự khai của các thành viên qua các ngôn ngữ riêng lẻ.
Trường và cấu trúc: Ngôn ngữ [thẻ] Trình độ [thẻ] Tên người dùng [thẻ] Chi tiết

Đánh giá câu của người dùng

Tên tệp: users_sentences.csv
Mô tả tập tin: Chứa các câu được người dùng đánh giá. Điểm số của đánh giá có thể là -1 (câu không OK), 0 (chưa quyết định hoặc không chắc chắn) hoặc 1 (câu OK). Cảnh báo: dữ liệu này vẫn đang được thử nghiệm.
Trường và cấu trúc: Tên người dùng [thẻ] Id câu [thẻ] Xem lại [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối

Phiên âm

Tên tệp: {{transcriptions | filename}}
Tất cả ngôn ngữ
Chỉ các câu trong: Tiếng Nhật Tiếng Quảng Đông Tiếng Trung Tiếng Uzbek
Mô tả tập tin: Chứa tất cả các phiên âm trong các tập lệnh (scripts) bổ trợ hoặc thay thế. Tên người dùng được liên kết với một bản ghi âm cho biết người dùng đã xem lại lần cuối và có thể đã sửa đổi nó. Một bản phiên âm không có tên người dùng chưa được đánh dấu là đã xem xét. Tên của tập lệnh được xác định theo tiêu chuẩn ISO 15924.
Trường và cấu trúc: Id câu [thẻ] Ngôn ngữ [thẻ] Tên tập lệnh [thẻ] Tên người dùng [thẻ] Phiên âm

Ghi chú

Thông tin chung về các tệp

Creative commons

Giấy phép bao gồm âm thanh

Thắc mắc?

Tải xuống

Câu

Câu chi tiết

Câu gốc và câu đã dịch

Câu (CC0)

Liên kết

Thẻ

Danh sách

Câu trong danh sách

Chỉ số Nhật Bản

Các câu có âm thanh

Cấp độ kỹ năng của người dùng cho mỗi ngôn ngữ

Đánh giá câu của người dùng

Phiên âm

Bạn cần giúp đỡ?

Nhà phát triển

Về chúng tôi

Ghi chú

Thông tin chung về các tệp

Creative commons

Giấy phép bao gồm âm thanh

Thắc mắc?

Tải xuống

Xuất nội dung tùy chỉnh

Các cặp câu

Xuất hàng tuần

Câu

Câu chi tiết

Câu gốc và câu đã dịch

Câu (CC0)

Liên kết

Thẻ

Danh sách

Câu trong danh sách

Chỉ số Nhật Bản

Các câu có âm thanh

Cấp độ kỹ năng của người dùng cho mỗi ngôn ngữ

Đánh giá câu của người dùng

Phiên âm

Bạn cần giúp đỡ?

Nhà phát triển

Về chúng tôi