menu
Tatoeba
language
Đăng ký Đăng nhập
language Tiếng Việt
menu
Tatoeba

chevron_right Đăng ký

chevron_right Đăng nhập

Duyệt

chevron_right Hiện câu ngẫu nhiên

chevron_right Duyệt theo ngôn ngữ

chevron_right Duyệt theo danh sách

chevron_right Duyệt theo thẻ

chevron_right Duyệt âm thanh

Cộng đồng

chevron_right Tường

chevron_right Danh sách thành viên

chevron_right Ngôn ngữ thành viên

chevron_right Người bản xứ

search
clear
swap_horiz
search

Ghi chú

Dữ liệu bạn tìm thấy ở đây sẽ KHÔNG hữu ích trừ khi bạn đang lập trình một công cụ ngôn ngữ hoặc đang xử lý dữ liệu.

Nếu bạn chỉ cần những câu mà bạn có thể dùng để học một ngôn ngữ, hãy xem danh sách sentence. Bạn có thể tạo cho riêng mình hoặc xem những thứ mà người khác tạo ra. Danh sách có thể được tải xuống và in.

Thông tin chung về các tệp

Nhiều câu tiếng Nhật và tiếng Anh có nguồn gốc từ Tanaka Corpus, thuộc phạm vi công cộng.

Creative commons

Các tệp này được phát hành theo CC BY 2.0 FR.

Creative Commons License CC-BY

Một phần các câu của chúng tôi cũng có sẵn theo CC0 1.0.

Creative Commons License CC0

Giấy phép bao gồm âm thanh

Giấy phép bao gồm một tệp âm thanh do người đóng góp chọn và được biểu thị trên trang liệt kê các tệp âm thanh mà người đó đã đóng góp.

Thắc mắc?

Nếu bạn có câu hỏi hoặc yêu cầu, vui lòng liên hệ với chúng tôi. Thông thường, chúng tôi trả lời rất nhanh.

Tải xuống

arrow_back

Xuất nội dung tùy chỉnh

Các cặp câu

Sử dụng công cụ này để tạo và tải xuống các bản xuất tùy chỉnh theo ý muốn.

translate Các cặp câu
Tải xuống tất cả câu bằng ngôn ngữ A với bản dịch bằng ngôn ngữ B

Tải xuống tất cả câu bằng ngôn ngữ A được dịch sang ngôn ngữ B, cùng với bản dịch.

Xuất hàng tuần

info Các tệp bên dưới được cập nhật vào thứ Bảy hàng tuần lúc 6:30 sáng (UTC).

Câu

Tên tệp

{{sentences | filename}}

Tất cả ngôn ngữ
Chỉ các câu trong: Abaza Aklanon Ancient Hebrew Ao Naga Avar Baluchi Baybayanon Berber Berom Bislama Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinook Jargon Chinyanja Coastal Kadazan Congo Swahili CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Evenki Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Isan Jin Chinese Juhuri (Judeo-Tat) K'iche' Kabardian Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khakas Khalaj Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Laz Lezgi Libyan Arabic Limburgish Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Mapuche Meitei Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Neapolitan Newari Ngeq Nigerian Fulfulde North Frisian North Levantine Arabic North Moluccan Malay Northern Haida Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nuer Nuosu Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Turkish Orizaba Nahuatl Pali Phoenician Pipil Plains Cree Pulaar Punjabi (Eastern) Punjabi (Western) Qashqai Quenya Rendille Rohingya Santali Saraiki Saterland Frisian Setswana Seychellois Creole Shuswap Silesian Sindarin South Levantine Arabic Southern Haida Southern Kurdish Southern Subanen Southern Zaza (Dimli) Sranan Tongo Standard Moroccan Tamazight Svan Swabian Sylheti Syriac Tachawit Tagal Murut Tahaggart Tamahaq Talossan Tarifit Tashelhit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Assam Tiếng Assyria Tiếng Asturias Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Java Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Liguria Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Marathi tiếng Mari Đông Tiếng Marshall Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shona Tiếng Sicilia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sudan Tiếng Sumeria Tiếng Swahili tiếng Swazi Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talysh Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tây Ban Nha Tiếng Tây Ban Nha cổ Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Turkmen Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza Tiếng Zulu Toki Pona Tonga (Zambezi) Tumbuka Tupinambá Tuvaluan Uab Meto Urhobo Wayuu West-Central Oromo Western Armenian Yakut Yucatec Maya Zeelandic Ngôn ngữ chưa rõ
Mô tả tập tin
Chứa tất cả các câu bằng ngôn ngữ đã chọn. Mỗi câu được liên kết với một id duy nhất và mã ngôn ngữ ISO 639-3.
Trường và cấu trúc
Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản

Câu chi tiết

Tên tệp

{{sentencesDetailed | filename}}

Tất cả ngôn ngữ
Chỉ các câu trong: Abaza Aklanon Ancient Hebrew Ao Naga Avar Baluchi Baybayanon Berber Berom Bislama Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinook Jargon Chinyanja Coastal Kadazan Congo Swahili CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Evenki Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Isan Jin Chinese Juhuri (Judeo-Tat) K'iche' Kabardian Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khakas Khalaj Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Laz Lezgi Libyan Arabic Limburgish Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Mapuche Meitei Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Neapolitan Newari Ngeq Nigerian Fulfulde North Frisian North Levantine Arabic North Moluccan Malay Northern Haida Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nuer Nuosu Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Turkish Orizaba Nahuatl Pali Phoenician Pipil Plains Cree Pulaar Punjabi (Eastern) Punjabi (Western) Qashqai Quenya Rendille Rohingya Santali Saraiki Saterland Frisian Setswana Seychellois Creole Shuswap Silesian Sindarin South Levantine Arabic Southern Haida Southern Kurdish Southern Subanen Southern Zaza (Dimli) Sranan Tongo Standard Moroccan Tamazight Svan Swabian Sylheti Syriac Tachawit Tagal Murut Tahaggart Tamahaq Talossan Tarifit Tashelhit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Assam Tiếng Assyria Tiếng Asturias Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Java Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Liguria Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Marathi tiếng Mari Đông Tiếng Marshall Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shona Tiếng Sicilia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sudan Tiếng Sumeria Tiếng Swahili tiếng Swazi Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talysh Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tây Ban Nha Tiếng Tây Ban Nha cổ Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Turkmen Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza Tiếng Zulu Toki Pona Tonga (Zambezi) Tumbuka Tupinambá Tuvaluan Uab Meto Urhobo Wayuu West-Central Oromo Western Armenian Yakut Yucatec Maya Zeelandic Ngôn ngữ chưa rõ
Mô tả tập tin
Chứa các trường bổ sung cho mỗi câu (tên chủ sở hữu, ngày tạo/sửa đổi).
Trường và cấu trúc
Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Tên người dùng [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối

Câu gốc và câu đã dịch

Tên tệp
sentences_base.tar.bz2
Mô tả tập tin
Mỗi câu được liệt kê là bản gốc hoặc bản dịch từ nơi khác. Trường "cơ sở" có thể có các giá trị sau:
  • zero: Câu là bản gốc, không phải bản dịch từ nơi khác.
  • lớn hơn 0: Id của câu gốc (mà các bản dịch khác dựa vào nó).
  • \N: Không xác định (hiếm).
Trường và cấu trúc
Id câu [thẻ] Trường cơ sở (base field)

Câu (CC0)

Tên tệp

{{sentencesCC0 | filename}}

Tất cả ngôn ngữ
Chỉ các câu trong: Ancient Hebrew Berber Konkani (Goan) Kven Finnish Láadan Nyungar Odia (Oriya) Old Aramaic Old Frisian Phoenician Santali Standard Moroccan Tamazight Sylheti Tachawit Tiếng Ả rập Tiếng Algeria Ả rập Tiếng Anh Tiếng Anh Trung cổ Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Ba Lan Tiếng Belarussia Tiếng Bengal Tiếng Bồ Đảo Nha Tiếng Catalan Tiếng Do Thái Tiếng Đan Mạch Tiếng Đức Tiếng Esperanto Tiếng Hà Lan Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp cổ Tiếng Ido Tiếng Interlingue Tiếng Kabyle Tiếng Karelian Tiếng Khoa Học Quốc Tế Tiếng Klingon Tiếng La tinh Tiếng Ladino Tiếng Liguria Tiếng Na Uy (Bokmål) Tiếng Na Uy cổ Tiếng Nga Tiếng Nhật Tiếng Pháp Tiếng Phần Lan Tiếng Quảng Đông Tiếng Séc Tiếng Tây Ban Nha Tiếng Thụy Điển Tiếng Trung Tiếng Trung cổ điển Tiếng Ukraine Tiếng Volapük Tiếng Wales Tiếng Ý Tiếng Yiddish Toki Pona Ngôn ngữ chưa rõ
Mô tả tập tin
Chứa tất cả các câu có sẵn trong CC0.
Trường và cấu trúc
Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Ngày sửa đổi lần cuối

Liên kết

Tên tệp
links.tar.bz2
Mô tả tập tin
Chứa các liên kết giữa các câu. 1 [thẻ] 77 có nghĩa là câu #77 là bản dịch của câu #1. Liên kết đối ứng cũng tồn tại, vì vậy tệp cũng sẽ chứa một dòng chỉ rõ 77 [thẻ] 1.
Trường và cấu trúc
Id câu [thẻ] Id bản dịch

Thẻ

Tên tệp
tags.tar.bz2
Mô tả tập tin
Chứa danh sách thẻ được liên kết với mỗi câu. 381279 [thẻ] proverb có nghĩa là câu #381279 đã được gán thẻ "tục ngữ".
Trường và cấu trúc
Id câu [thẻ] Tag tên

Danh sách

Tên tệp
user_lists.tar.bz2
Mô tả tập tin
Chứa danh sách danh sách câu.
Trường và cấu trúc
Id danh sách [thẻ] Tên người dùng [thẻ] Ngày tạo [thẻ] Ngày sửa đổi lần cuối [thẻ] Tên danh sách [thẻ] Có thể chỉnh sửa bởi

Câu trong danh sách

Tên tệp
sentences_in_lists.tar.bz2
Mô tả tập tin
Cho biết các câu được chứa trong bất kỳ danh sách nào. 13 [thẻ] 381279 có nghĩa là câu #381279 được chứa trong danh sách có id là 13.
Trường và cấu trúc
Id danh sách [thẻ] Id câu

Chỉ số Nhật Bản

Tên tệp
jpn_indices.tar.bz2
Mô tả tập tin
Chứa nội dung tương đương với "dòng B" trong tệp Tanaka Corpus được phân phối bởi Jim Breen. Xem trang này để biết định dạng. Mỗi mục nhập được liên kết với một cặp câu tiếng Nhật/Anh. Id câu đề cập đến id của câu tiếng Nhật. Id nghĩa đề cập đến id của câu tiếng Anh.
Trường và cấu trúc
Id câu [thẻ] Id nghĩa [thẻ] Văn bản

Các câu có âm thanh

Tên tệp
sentences_with_audio.tar.bz2
Mô tả tập tin
Chứa id của các câu, bằng mọi ngôn ngữ, đã có sẵn âm thanh. Các trường khác cho biết ai đã tạo âm thanh, giấy phép của nó và URL để gán tác giả. Nếu trường cấp phép trống, bạn không thể sử dụng lại âm thanh bên ngoài dự án Tatoeba.
Downloading audio
A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
Trường và cấu trúc
Id câu [thẻ] Audio id [thẻ] Tên người dùng [thẻ] Giấy phép [thẻ] URL phân bổ

Cấp độ kỹ năng của người dùng cho mỗi ngôn ngữ

Tên tệp
user_languages.tar.bz2
Mô tả tập tin
Cho thấy cấp độ kỹ năng tự khai của các thành viên qua các ngôn ngữ riêng lẻ.
Trường và cấu trúc
Ngôn ngữ [thẻ] Trình độ [thẻ] Tên người dùng [thẻ] Chi tiết

Đánh giá câu của người dùng

Tên tệp
users_sentences.csv
Mô tả tập tin
Chứa các câu được người dùng đánh giá. Điểm số của đánh giá có thể là -1 (câu không OK), 0 (chưa quyết định hoặc không chắc chắn) hoặc 1 (câu OK). Cảnh báo: dữ liệu này vẫn đang được thử nghiệm.
Trường và cấu trúc
Tên người dùng [thẻ] Id câu [thẻ] Xem lại [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối

Phiên âm

Tên tệp

{{transcriptions | filename}}

Tất cả ngôn ngữ
Chỉ các câu trong: Tiếng Nhật Tiếng Quảng Đông Tiếng Trung Tiếng Uzbek
Mô tả tập tin
Chứa tất cả các phiên âm trong các tập lệnh (scripts) bổ trợ hoặc thay thế. Tên người dùng được liên kết với một bản ghi âm cho biết người dùng đã xem lại lần cuối và có thể đã sửa đổi nó. Một bản phiên âm không có tên người dùng chưa được đánh dấu là đã xem xét. Tên của tập lệnh được xác định theo tiêu chuẩn ISO 15924.
Trường và cấu trúc
Id câu [thẻ] Ngôn ngữ [thẻ] Tên tập lệnh [thẻ] Tên người dùng [thẻ] Phiên âm