Ghi chú
Dữ liệu bạn tìm thấy ở đây sẽ KHÔNG hữu ích trừ khi bạn đang lập trình một công cụ ngôn ngữ hoặc đang xử lý dữ liệu.
Nếu bạn chỉ cần những câu mà bạn có thể dùng để học một ngôn ngữ, hãy xem danh sách sentence. Bạn có thể tạo cho riêng mình hoặc xem những thứ mà người khác tạo ra. Danh sách có thể được tải xuống và in.
Thông tin chung về các tệp
Nhiều câu tiếng Nhật và tiếng Anh có nguồn gốc từ Tanaka Corpus, thuộc phạm vi công cộng.
Creative commons
Các tệp này được phát hành theo CC BY 2.0 FR.

Một phần các câu của chúng tôi cũng có sẵn theo CC0 1.0.

Giấy phép bao gồm âm thanh
Giấy phép bao gồm một tệp âm thanh do người đóng góp chọn và được biểu thị trên trang liệt kê các tệp âm thanh mà người đó đã đóng góp.
Thắc mắc?
Nếu bạn có câu hỏi hoặc yêu cầu, vui lòng liên hệ với chúng tôi. Thông thường, chúng tôi trả lời rất nhanh.
Tải xuống
Sử dụng công cụ này để tạo và tải xuống các bản xuất tùy chỉnh theo ý muốn.
Tải xuống tất cả câu bằng ngôn ngữ A được dịch sang ngôn ngữ B, cùng với bản dịch.
Câu
- Tên tệp
-
Tất cả ngôn ngữ Chỉ các câu trong: Abaza Aklanon Ancient Hebrew Ao Naga Avar Baluchi Baybayanon Berber Berom Bislama Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinook Jargon Chinyanja Coastal Kadazan Congo Swahili CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Evenki Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Isan Jin Chinese Juhuri (Judeo-Tat) K'iche' Kabardian Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khakas Khalaj Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Laz Lezgi Libyan Arabic Limburgish Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Mapuche Meitei Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Neapolitan Newari Ngeq Nigerian Fulfulde North Frisian North Levantine Arabic North Moluccan Malay Northern Haida Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nuer Nuosu Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Turkish Orizaba Nahuatl Pali Phoenician Pipil Plains Cree Pulaar Punjabi (Eastern) Punjabi (Western) Qashqai Quenya Rendille Rohingya Santali Saraiki Saterland Frisian Setswana Seychellois Creole Shuswap Silesian Sindarin South Levantine Arabic Southern Haida Southern Kurdish Southern Subanen Southern Zaza (Dimli) Sranan Tongo Standard Moroccan Tamazight Svan Swabian Sylheti Syriac Tachawit Tagal Murut Tahaggart Tamahaq Talossan Tarifit Tashelhit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Assam Tiếng Assyria Tiếng Asturias Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Java Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Liguria Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Marathi tiếng Mari Đông Tiếng Marshall Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shona Tiếng Sicilia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sudan Tiếng Sumeria Tiếng Swahili tiếng Swazi Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talysh Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tây Ban Nha Tiếng Tây Ban Nha cổ Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Turkmen Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza Tiếng Zulu Toki Pona Tonga (Zambezi) Tumbuka Tupinambá Tuvaluan Uab Meto Urhobo Wayuu West-Central Oromo Western Armenian Yakut Yucatec Maya Zeelandic Ngôn ngữ chưa rõ - Mô tả tập tin
- Chứa tất cả các câu bằng ngôn ngữ đã chọn. Mỗi câu được liên kết với một id duy nhất và mã ngôn ngữ ISO 639-3.
- Trường và cấu trúc
- Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản
Câu chi tiết
- Tên tệp
-
{{sentencesDetailed | filename}}
Tất cả ngôn ngữ Chỉ các câu trong: Abaza Aklanon Ancient Hebrew Ao Naga Avar Baluchi Baybayanon Berber Berom Bislama Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinook Jargon Chinyanja Coastal Kadazan Congo Swahili CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Evenki Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Isan Jin Chinese Juhuri (Judeo-Tat) K'iche' Kabardian Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Khakas Khalaj Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Laz Lezgi Libyan Arabic Limburgish Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Mapuche Meitei Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Neapolitan Newari Ngeq Nigerian Fulfulde North Frisian North Levantine Arabic North Moluccan Malay Northern Haida Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nuer Nuosu Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Turkish Orizaba Nahuatl Pali Phoenician Pipil Plains Cree Pulaar Punjabi (Eastern) Punjabi (Western) Qashqai Quenya Rendille Rohingya Santali Saraiki Saterland Frisian Setswana Seychellois Creole Shuswap Silesian Sindarin South Levantine Arabic Southern Haida Southern Kurdish Southern Subanen Southern Zaza (Dimli) Sranan Tongo Standard Moroccan Tamazight Svan Swabian Sylheti Syriac Tachawit Tagal Murut Tahaggart Tamahaq Talossan Tarifit Tashelhit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Assam Tiếng Assyria Tiếng Asturias Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Java Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Liguria Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Marathi tiếng Mari Đông Tiếng Marshall Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shona Tiếng Sicilia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sudan Tiếng Sumeria Tiếng Swahili tiếng Swazi Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talysh Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tây Ban Nha Tiếng Tây Ban Nha cổ Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Turkmen Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza Tiếng Zulu Toki Pona Tonga (Zambezi) Tumbuka Tupinambá Tuvaluan Uab Meto Urhobo Wayuu West-Central Oromo Western Armenian Yakut Yucatec Maya Zeelandic Ngôn ngữ chưa rõ - Mô tả tập tin
- Chứa các trường bổ sung cho mỗi câu (tên chủ sở hữu, ngày tạo/sửa đổi).
- Trường và cấu trúc
- Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Tên người dùng [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối
Câu gốc và câu đã dịch
- Tên tệp
- sentences_base.tar.bz2
- Mô tả tập tin
-
Mỗi câu được liệt kê là bản gốc hoặc bản dịch từ nơi khác. Trường "cơ sở" có thể có các giá trị sau:
- zero: Câu là bản gốc, không phải bản dịch từ nơi khác.
- lớn hơn 0: Id của câu gốc (mà các bản dịch khác dựa vào nó).
- \N: Không xác định (hiếm).
- Trường và cấu trúc
- Id câu [thẻ] Trường cơ sở (base field)
Câu (CC0)
- Tên tệp
-
Tất cả ngôn ngữ Chỉ các câu trong: Ancient Hebrew Berber Konkani (Goan) Kven Finnish Láadan Nyungar Odia (Oriya) Old Aramaic Old Frisian Phoenician Santali Standard Moroccan Tamazight Sylheti Tachawit Tiếng Ả rập Tiếng Algeria Ả rập Tiếng Anh Tiếng Anh Trung cổ Tiếng Aram của người Do Thái vùng Babylon Tiếng Aram của người Do Thái vùng Palestine Tiếng Ba Lan Tiếng Belarussia Tiếng Bengal Tiếng Bồ Đảo Nha Tiếng Catalan Tiếng Do Thái Tiếng Đan Mạch Tiếng Đức Tiếng Esperanto Tiếng Hà Lan Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp cổ Tiếng Ido Tiếng Interlingue Tiếng Kabyle Tiếng Karelian Tiếng Khoa Học Quốc Tế Tiếng Klingon Tiếng La tinh Tiếng Ladino Tiếng Liguria Tiếng Na Uy (Bokmål) Tiếng Na Uy cổ Tiếng Nga Tiếng Nhật Tiếng Pháp Tiếng Phần Lan Tiếng Quảng Đông Tiếng Séc Tiếng Tây Ban Nha Tiếng Thụy Điển Tiếng Trung Tiếng Trung cổ điển Tiếng Ukraine Tiếng Volapük Tiếng Wales Tiếng Ý Tiếng Yiddish Toki Pona Ngôn ngữ chưa rõ - Mô tả tập tin
- Chứa tất cả các câu có sẵn trong CC0.
- Trường và cấu trúc
- Id câu [thẻ] Ngôn ngữ [thẻ] Văn bản [thẻ] Ngày sửa đổi lần cuối
Liên kết
- Tên tệp
- links.tar.bz2
- Mô tả tập tin
- Chứa các liên kết giữa các câu. 1 [thẻ] 77 có nghĩa là câu #77 là bản dịch của câu #1. Liên kết đối ứng cũng tồn tại, vì vậy tệp cũng sẽ chứa một dòng chỉ rõ 77 [thẻ] 1.
- Trường và cấu trúc
- Id câu [thẻ] Id bản dịch
Thẻ
- Tên tệp
- tags.tar.bz2
- Mô tả tập tin
- Chứa danh sách thẻ được liên kết với mỗi câu. 381279 [thẻ] proverb có nghĩa là câu #381279 đã được gán thẻ "tục ngữ".
- Trường và cấu trúc
- Id câu [thẻ] Tag tên
Danh sách
- Tên tệp
- user_lists.tar.bz2
- Mô tả tập tin
- Chứa danh sách danh sách câu.
- Trường và cấu trúc
- Id danh sách [thẻ] Tên người dùng [thẻ] Ngày tạo [thẻ] Ngày sửa đổi lần cuối [thẻ] Tên danh sách [thẻ] Có thể chỉnh sửa bởi
Câu trong danh sách
- Tên tệp
- sentences_in_lists.tar.bz2
- Mô tả tập tin
- Cho biết các câu được chứa trong bất kỳ danh sách nào. 13 [thẻ] 381279 có nghĩa là câu #381279 được chứa trong danh sách có id là 13.
- Trường và cấu trúc
- Id danh sách [thẻ] Id câu
Chỉ số Nhật Bản
- Tên tệp
- jpn_indices.tar.bz2
- Mô tả tập tin
- Chứa nội dung tương đương với "dòng B" trong tệp Tanaka Corpus được phân phối bởi Jim Breen. Xem trang này để biết định dạng. Mỗi mục nhập được liên kết với một cặp câu tiếng Nhật/Anh. Id câu đề cập đến id của câu tiếng Nhật. Id nghĩa đề cập đến id của câu tiếng Anh.
- Trường và cấu trúc
- Id câu [thẻ] Id nghĩa [thẻ] Văn bản
Các câu có âm thanh
- Tên tệp
- sentences_with_audio.tar.bz2
- Mô tả tập tin
- Chứa id của các câu, bằng mọi ngôn ngữ, đã có sẵn âm thanh. Các trường khác cho biết ai đã tạo âm thanh, giấy phép của nó và URL để gán tác giả. Nếu trường cấp phép trống, bạn không thể sử dụng lại âm thanh bên ngoài dự án Tatoeba.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Trường và cấu trúc
- Id câu [thẻ] Audio id [thẻ] Tên người dùng [thẻ] Giấy phép [thẻ] URL phân bổ
Cấp độ kỹ năng của người dùng cho mỗi ngôn ngữ
- Tên tệp
- user_languages.tar.bz2
- Mô tả tập tin
- Cho thấy cấp độ kỹ năng tự khai của các thành viên qua các ngôn ngữ riêng lẻ.
- Trường và cấu trúc
- Ngôn ngữ [thẻ] Trình độ [thẻ] Tên người dùng [thẻ] Chi tiết
Đánh giá câu của người dùng
- Tên tệp
- users_sentences.csv
- Mô tả tập tin
- Chứa các câu được người dùng đánh giá. Điểm số của đánh giá có thể là -1 (câu không OK), 0 (chưa quyết định hoặc không chắc chắn) hoặc 1 (câu OK). Cảnh báo: dữ liệu này vẫn đang được thử nghiệm.
- Trường và cấu trúc
- Tên người dùng [thẻ] Id câu [thẻ] Xem lại [thẻ] Ngày thêm vào [thẻ] Ngày sửa đổi lần cuối
Phiên âm
- Tên tệp
-
Tất cả ngôn ngữ Chỉ các câu trong: Tiếng Nhật Tiếng Quảng Đông Tiếng Trung Tiếng Uzbek - Mô tả tập tin
- Chứa tất cả các phiên âm trong các tập lệnh (scripts) bổ trợ hoặc thay thế. Tên người dùng được liên kết với một bản ghi âm cho biết người dùng đã xem lại lần cuối và có thể đã sửa đổi nó. Một bản phiên âm không có tên người dùng chưa được đánh dấu là đã xem xét. Tên của tập lệnh được xác định theo tiêu chuẩn ISO 15924.
- Trường và cấu trúc
- Id câu [thẻ] Ngôn ngữ [thẻ] Tên tập lệnh [thẻ] Tên người dùng [thẻ] Phiên âm