Note
Dữ liệu bạn sẽ tìm thấy ở đây sẽ KHÔNG hữu ích trừ khi bạn đang mã hóa một công cụ ngôn ngữ hoặc xử lý dữ liệu.
Nếu bạn chỉ đơn giản muốn tìm những câu mà bạn có thể sử dụng để học một thứ tiếng, bạn có thể tham khảo danh sách câu. Bạn có thể tự xây dựng danh sách hoặc xem những danh sách của thành viên khác. Các danh sách có thể được tải xuống và in.
Thông tin tổng quát về các tệp tin
Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.
Tài sản sáng tạo công cộng
These files are released under CC BY 2.0 FR.

A part of our sentences are also available under CC0 1.0.

Licenses covering audio
The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.
Câu hỏi?
If you have questions or requests, feel free to contact us. In general, we answer quickly.
Tải về
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
Câu
- Tên tệp
-
Tất cả các ngôn ngữ Only sentences in: Abaza Ancient Hebrew Baybayanon Berber Berom Biệt ngữ Chinook Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Babylonian Aramaic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Lezgi Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nhóm ngôn ngữ Aklanon Nigerian Fulfulde North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Spanish Old Turkish Orizaba Nahuatl Pipil Pulaar Punjabi (Eastern) Punjabi (Western) Quenya Rendille Setswana Seychellois Creole Shuswap Sindarin South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập Levant Tiếng Ả Rập Libya Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Armenia Tây Tiếng Assam Tiếng Assyria Tiếng Asturias tiếng Avar Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Baluchi Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria tiếng Bắc Frisia Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bislama Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Đức Swabia Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Evenk Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi tiếng Frisia Saterland Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haida Tiếng Haida miền Nam Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Isan Tiếng Java Tiếng Kabardian Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khakas Tiếng Khalaj Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kurd Miền Nam Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Laz Tiếng Liguria Tiếng Limburg Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Lô Lô tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Mapuche Tiếng Marathi tiếng Mari Đông tiếng Mari Tây Tiếng Marshall Tiếng Maya Yucatán Tiếng Meitei Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ Tiếng Napoli tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Newari Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Nuer Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pali Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phoenicia Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Plains Cree Tiếng Qashqai Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Rohingya Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sakha Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Santali Tiếng Saraiki Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shilha Tiếng Shona Tiếng Sicilia tiếng Silesia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sranan Tongo Tiếng Sudan Tiếng Sumeria Tiếng Swahili Tiếng Swahili Congo tiếng Swazi Tiếng Sylhet Tiếng Syriac Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talossa Tiếng Talysh Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tấn Tiếng Tây Ban Nha Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Tumbuka Tiếng Turkmen Tiếng Tuvalu Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza tiếng Zeeland Tiếng Zulu Toki Pona Tonga (Zambezi) Tupinambá Uab Meto Urhobo Wayuu West-Central Oromo Không rõ ngôn ngữ - Mô tả tệp
- Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
- Trường và cấu trúc
- Id của câu [tab] Ngôn ngữ [tab] Văn bản
Detailed Sentences
- Tên tệp
-
{{sentencesDetailed | filename}}
Tất cả các ngôn ngữ Only sentences in: Abaza Ancient Hebrew Baybayanon Berber Berom Biệt ngữ Chinook Brithenig Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan CycL Drents Dutton World Speedwords Eastern Armenian Erromintxela Frisian Gronings Guadeloupean Creole French Guerrero Nahuatl Gun Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Babylonian Aramaic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Kelantan-Pattani Malay Keningau Murut Kölsch Komi-Zyrian Konkani (Goan) Kotava Kven Finnish Láadan Lezgi Lingua Franca Nova Low German (Low Saxon) Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nhóm ngôn ngữ Aklanon Nigerian Fulfulde North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Novial Nyungar O'odham Odia (Oriya) Old Aramaic Old Frisian Old Spanish Old Turkish Orizaba Nahuatl Pipil Pulaar Punjabi (Eastern) Punjabi (Western) Quenya Rendille Setswana Seychellois Creole Shuswap Sindarin South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Temuan Tetun thổ ngữ Jamaica Tiếng Tiếng Ả rập Tiếng Ả Rập Levant Tiếng Ả Rập Libya Tiếng Ả Rập vùng Vịnh tiếng Abkhaz Tiếng Adyghe Tiếng Afrihili Tiếng Afrikaans Tiếng Ai Cập Ả rập Tiếng Ainu Tiếng Algeria Ả rập Tiếng Altai Miền Nam Tiếng Amharic Tiếng Anh Tiếng Anh cổ Tiếng Anh Trung cổ Tiếng Aragon Tiếng Armenia Tây Tiếng Assam Tiếng Assyria Tiếng Asturias tiếng Avar Tiếng Awadhi Tiếng Aymara Tiếng Azerbaijan Tiếng Ba Lan Tiếng Ba Tư Tiếng Bali Tiếng Baluchi Tiếng Bambara Tiếng Banjar Tiếng Bashkir Tiếng Basque Tiếng Bavaria tiếng Bắc Frisia Tiếng Belarussia Tiếng Bengal Tiếng Bhojpuri Tiếng Bikol Trung Tiếng Bislama Tiếng Bodo Tiếng Bosina Tiếng Bồ Đảo Nha Tiếng Breton Tiếng Bulgaria tiếng Buryat Tiếng Catalan Tiếng Cayuga Tiếng Cebuano Tiếng Chagatai Tiếng Chamorro tiếng Chavacano Tiếng Chechen Tiếng Cherokee Tiếng Choctaw Tiếng Chukchi Tiếng Chuvash Tiếng Cornwall Tiếng Corsica Tiếng Creole Louisiana Tiếng Croatia Tiếng Cuyonon tiếng Dhivehi tiếng Digan Tiếng Do Thái Tiếng Dusun Miền Trung Tiếng Đan Mạch Tiếng Đông Can Tiếng Đức Tiếng Đức (Thụy Sĩ) Tiếng Đức Palatine Tiếng Đức Pennsylvania Tiếng Đức Swabia Tiếng Emilia Tiếng Erzya Tiếng Esperanto Tiếng Estonia Tiếng Evenk Tiếng Ewe Tiếng Extremadura Tiếng Faroe Tiếng Fiji Tiếng Fiji Hindi tiếng Frisia Saterland Tiếng Friulian Tiếng Ga Tiếng Gael Scotland Tiếng Gagauz Tiếng Galician Tiếng Garhwal Tiếng Georgia Tiếng Gheg Albani Tiếng Gilbert Tiếng Gô-tích tiếng Greenland Tiếng Guarani Tiếng Gujarati Tiếng Hà Lan Tiếng Hạ Sorbia Tiếng Haida Tiếng Haida miền Nam Tiếng Haiti Tiếng Hausa Tiếng Hawaii Tiếng Hiligaynon Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp Tiếng Hy Lạp cổ Tiếng Iban Tiếng Iceland Tiếng Ido Tiếng Igbo tiếng Ilokano Tiếng Indo Tiếng Ingria Tiếng Interlingue Tiếng Inuktitut Tiếng Iraq Ả Rập Tiếng Ireland Tiếng Isan Tiếng Java Tiếng Kabardian Tiếng Kabyle Tiếng Kalmyk Tiếng Kamba Tiếng Kannada tiếng Kapampangan Tiếng Karachay-Balkar tiếng Karakalpak Tiếng Karelian Tiếng Kashmir Tiếng Kashubia Tiếng Kazakhstan Tiếng Khakas Tiếng Khalaj Tiếng Khasi Tiếng Khoa Học Quốc Tế Tiếng Khơ me Tiếng Kinyarwanda tiếng Kirundi Tiếng Klingon Tiếng Komi-Permyak Tiếng Kumyk Tiếng Kurd Miền Nam Tiếng Kyrgyz Tiếng La tinh Tiếng Ladin Tiếng Ladino Tiếng Lakota Tiếng Lào tiếng Latgale Tiếng Latvia Tiếng Laz Tiếng Liguria Tiếng Limburg Tiếng Lingala Tiếng Litva Tiếng Livonia Tiếng Lojban tiếng Lombard tiếng Lô Lô tiếng Luganda Tiếng Luxembourg Tiếng Mã Lai Tiếng Macedonia Tiếng Madura Tiếng Maithili Tiếng Malagasy Tiếng Malayalam Tiếng Malta Tiếng Mãn Châu Tiếng Manx Tiếng Maori Tiếng Mapuche Tiếng Marathi tiếng Mari Đông tiếng Mari Tây Tiếng Marshall Tiếng Maya Yucatán Tiếng Meitei Tiếng Micmac Tiếng Miến Điện Tiếng Minangkabau tiếng Mingrelia Tiếng Miranda Tiếng Mohawk Tiếng Moksha Tiếng Morisyen Tiếng Morocco Ả Rập Tiếng Môn Tiếng Mông Cổ Tiếng Na Uy (Bokmål) Tiếng Na Uy (Nynorsk) Tiếng Na Uy cổ Tiếng Napoli tiếng Nauru Tiếng Navajo Tiếng Nepal Tiếng Newari Tiếng Nga Tiếng Nhật Tiếng Niuean Tiếng Nogai Tiếng Nuer Tiếng Occitan Tiếng Ojibwe Tiếng Okinawa tiếng Ossetia Tiếng Palauan Tiếng Pali Tiếng Pangasinan Tiếng Papiamento Tiếng Pashto Tiếng Phạn Tiếng Pháp Tiếng Pháp cổ Tiếng Pháp Trung cổ Tiếng Phần Lan Tiếng Phoenicia Tiếng Phổ cổ tiếng Picard tiếng Piemonte Tiếng Plains Cree Tiếng Qashqai Tiếng Quảng Đông Tiếng Quechua Tiếng Rapa Nui Tiếng Rohingya Tiếng Romania Tiếng Romansh tiếng Rusyn Tiếng Sakha Tiếng Sami Miền Bắc Tiếng Sami Miền Nam Tiếng Samoa tiếng Samogitia Tiếng Sango Tiếng Santali Tiếng Saraiki Tiếng Sardinia Tiếng Saxon cổ Tiếng Scots Tiếng Séc Tiếng Shilha Tiếng Shona Tiếng Sicilia tiếng Silesia Tiếng Sindhi Tiếng Sinhala Tiếng Slavic phía đông cổ Tiếng Slovakia Tiếng Slovenia Tiếng Somalia Tiếng Sotho Miền Nam Tiếng Sranan Tongo Tiếng Sudan Tiếng Sumeria Tiếng Swahili Tiếng Swahili Congo tiếng Swazi Tiếng Sylhet Tiếng Syriac Tiếng Tagalog Tiếng Tahiti Tiếng Tajik Tiếng Talossa Tiếng Talysh Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tamil Tiếng Tatar tiếng Tatar Krym Tiếng Tấn Tiếng Tây Ban Nha Tiếng Tây Tạng Tiếng Telugu Tiếng Thái Tiếng Thổ Nhĩ Kỳ Tiếng Thổ Ottoman Tiếng Thụy Điển Tiếng Thượng Hải Tiếng Thượng Sorbia Tiếng Tigre Tiếng Tigrinya Tiếng Tok Pisin Tiếng Tokelau Tiếng Tonga Tiếng Triều Tiên Tiếng Trung Tiếng Trung cổ điển Tiếng Trung Gan Tiếng Trung Hakka Tiếng Trung Min Nan Tiếng Trung Xiang Tiếng Tsonga Tiếng Tumbuka Tiếng Turkmen Tiếng Tuvalu Tiếng Tuvinian Tiếng Udmurt Tiếng Ukraine Tiếng Umbundu Tiếng Urdu Tiếng Uyghur Tiếng Uzbek tiếng Venezia tiếng Veps Tiếng Việt Tiếng Volapük tiếng Võro Tiếng Wales Tiếng Walloon Tiếng Waray Tiếng Wolof Tiếng Xéc bi Tiếng Xhosa Tiếng Ý Tiếng Yiddish Tiếng Yoruba Tiếng Zaza tiếng Zeeland Tiếng Zulu Toki Pona Tonga (Zambezi) Tupinambá Uab Meto Urhobo Wayuu West-Central Oromo Không rõ ngôn ngữ - Mô tả tệp
- Contains additional fields for each sentence (owner name, date created/modified).
- Trường và cấu trúc
- Id của câu [tab] Ngôn ngữ [tab] Văn bản [tab] Tên người dùng [tab] Ngày thêm vào [tab] Ngày chỉnh sửa gần nhất
Original and Translated Sentences
- Tên tệp
- sentences_base.tar.bz2
- Mô tả tệp
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Trường và cấu trúc
- Id của câu [tab] Base field
Sentences (CC0)
- Tên tệp
-
Tất cả các ngôn ngữ Only sentences in: Ancient Hebrew Berber Jewish Babylonian Aramaic Jewish Palestinian Aramaic Konkani (Goan) Kven Finnish Láadan Nyungar Odia (Oriya) Old Aramaic Old Frisian Tachawit Tiếng Ả rập Tiếng Algeria Ả rập Tiếng Anh Tiếng Anh Trung cổ Tiếng Ba Lan Tiếng Belarussia Tiếng Bengal Tiếng Bồ Đảo Nha Tiếng Catalan Tiếng Do Thái Tiếng Đan Mạch Tiếng Đức Tiếng Esperanto Tiếng Hà Lan Tiếng Hindi Tiếng Ho Tiếng Hungary Tiếng Hy Lạp cổ Tiếng Ido Tiếng Interlingue Tiếng Kabyle Tiếng Karelian Tiếng Khoa Học Quốc Tế Tiếng Klingon Tiếng La tinh Tiếng Ladino Tiếng Liguria Tiếng Na Uy (Bokmål) Tiếng Na Uy cổ Tiếng Nga Tiếng Nhật Tiếng Pháp Tiếng Phần Lan Tiếng Phoenicia Tiếng Quảng Đông Tiếng Santali Tiếng Séc Tiếng Sylhet Tiếng Tamazight Chuẩn của Ma-rốc Tiếng Tây Ban Nha Tiếng Thụy Điển Tiếng Trung Tiếng Trung cổ điển Tiếng Ukraine Tiếng Volapük Tiếng Wales Tiếng Ý Tiếng Yiddish Toki Pona Không rõ ngôn ngữ - Mô tả tệp
- Contains all the sentences available under CC0.
- Trường và cấu trúc
- Id của câu [tab] Ngôn ngữ [tab] Văn bản [tab] Ngày chỉnh sửa gần nhất
LIên kết
- Tên tệp
- links.tar.bz2
- Mô tả tệp
- Contains the links between the sentences. 1 [tab] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [tab] 1.
- Trường và cấu trúc
- Id của câu [tab] Id bản dịch
Thẻ
- Tên tệp
- tags.tar.bz2
- Mô tả tệp
- Contains the list of tags associated with each sentence. 381279 [tab] proverb means that sentence #381279 has been assigned the "proverb" tag.
- Trường và cấu trúc
- Id của câu [tab] Tên thẻ
Danh sách
- Tên tệp
- user_lists.tar.bz2
- Mô tả tệp
- Contains the list of sentence lists.
- Trường và cấu trúc
- Id danh sách [tab] Tên người dùng [tab] Ngày tạo [tab] Ngày chỉnh sửa gần nhất [tab] Tên danh sách [tab] Có thể chỉnh sửa bởi
Câu theo danh sách
- Tên tệp
- sentences_in_lists.tar.bz2
- Mô tả tệp
- Indicates the sentences that are contained by any lists. 13 [tab] 381279 means that sentence #381279 is contained by the list that has an id of 13.
- Trường và cấu trúc
- Id danh sách [tab] Id của câu
Japanese indices
- Tên tệp
- jpn_indices.tar.bz2
- Mô tả tệp
- Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Id của câu refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
- Trường và cấu trúc
- Id của câu [tab] Meaning id [tab] Văn bản
Câu kèm âm thanh
- Tên tệp
- sentences_with_audio.tar.bz2
- Mô tả tệp
- Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Trường và cấu trúc
- Id của câu [tab] Audio id [tab] Tên người dùng [tab] Giấy phép [tab] Attribution URL
Trình độ của người dùng theo ngôn ngữ
- Tên tệp
- user_languages.tar.bz2
- Mô tả tệp
- Indicates the self-reported skill levels of members in individual languages.
- Trường và cấu trúc
- Ngôn ngữ [tab] Trình độ [tab] Tên người dùng [tab] Chi tiết
Những đánh giá câu của người dùng
- Tên tệp
- users_sentences.csv
- Mô tả tệp
- Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
- Trường và cấu trúc
- Tên người dùng [tab] Id của câu [tab] Đánh giá [tab] Ngày thêm vào [tab] Ngày chỉnh sửa gần nhất
Transcriptions
- Tên tệp
-
Tất cả các ngôn ngữ Only sentences in: Tiếng Nhật Tiếng Quảng Đông Tiếng Trung Tiếng Uzbek - Mô tả tệp
- Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
- Trường và cấu trúc
- Id của câu [tab] Ngôn ngữ [tab] Script name [tab] Tên người dùng [tab] Bản phiên âm