menu
Tatoeba
language 中文
注册 登录
language 中文
menu
Tatoeba
浏览

chevron_right Show random sentence

chevron_right 选择语言

chevron_right 选择列表

chevron_right 选择标签

chevron_right 选择音频

Community

chevron_right 留言板

chevron_right List of all members

chevron_right Languages of members

chevron_right 母语者

clear
{{language.name}} No language found.
swap_horiz
{{language.name}} No language found.
search

备注

The data you will find here will NOT be useful unless you are coding a language tool or processing data.

If you simply want sentences that you can use to learn a language, check out the sentence lists. You can build your own, or view the ones that others have created. The lists can be downloaded and printed.

General information about the files

The files provided here are updated every Saturday at 6:30 a.m. (UTC).

Many of the Japanese and English sentences are from the Tanaka Corpus, which belongs to the public domain.

Creative commons

These files are released under CC BY 2.0 FR.

Creative Commons License CC-BY

A part of our sentences are also available under CC0 1.0.

Creative Commons License CC0

Licenses covering audio

The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.

Questions?

If you have questions or requests, feel free to contact us. In general, we answer quickly.

下载

句子

Filename

{{sentences | filename}}

所有语言
Only sentences in: Brithenig Central Mnong Cyc项目专用语言 Dutton World Speedwords Karakhanid Kekchi (Q'eqchi') Keningau Murut Malay (Vernacular) Naga (Tangshang) Ngeq Northern Haida Nyungar South Levantine Arabic Southern Haida Southern Subanen Tagal Murut Temuan 上海话 上索布语 下索布语 世界语 东干语 中世纪法语 中世纪英语 中古西班牙語 中文普通话 中比科爾語 中瓦斯特克纳瓦特尔语 丹麦语 乌克兰语 乌兹别克语 乌尔都语 乌德穆尔特语 乔克托语 书面挪威语 亚美尼亚语 亞述新亞蘭語 伊博语 伊多语 伊拉克阿拉伯语 伊洛卡诺语 伊班语 伦迪尔语 低地德语(低地撒克逊语) 佛罗语 依善语 俄语 保加利亚语 信德语 修纳语 俾路支语 倫巴底語 僧伽罗语 克什米尔语 克文语 克林贡语 克罗地亚语 克里米亞韃靼語 冰岛语 冲绳语 切罗基语 利古里亚语 加利西亚语 加告兹语 加尔华里语 加族语 加泰罗尼亚语 匈牙利语 北弗里斯兰语 北摩鹿加群岛马来语 北方萨米语 北黎凡特阿拉伯语 匹普语 南索托语 南萨米语 南非荷兰语 博多语 博杰普尔语 卡姆巴语 卡尔梅克语 卡尤加语 卡拉卡尔帕克语 卡拉恰伊巴尔卡尔语 卡拜尔语 卡累利阿语 卡纳达语 卡舒比语 卡西语 卡达山语 卢干达语 卢森堡语 卢森尼亚语 印地语 印尼语 厄尔兹亚语 古东斯拉夫语 古亞拉姆語 古代突厥语 古吉拉特语 古希伯来语 古希腊语 古普鲁士语 古法语 古英语 古薩克森語 古诺尔斯语 史瓦濟語 吉尔伯特语 吉尔吉斯坦语 哈卡斯语 哈萨克语 哥特语 因纽特语 国际语 国际语 图瓦卢语 图瓦语 土库曼语 土耳其语 埃及阿拉伯语 埃斯特雷馬杜拉語 埃维语 基切语 基尼亚卢旺达语 基隆迪语 塔加路语 塔吉克语 塔希提语 塔罗萨语 塔雷什语 塞尔维亚语 塞舌尔克里奥尔语 夏威夷语 奇努克混合语 奥地利-巴伐利亚语 奥塞梯语 奥斯曼土耳其语 奥杰布瓦语 奥里亚语 奥里萨巴纳瓦特尔语 威尔士语 威尼斯語 孔卡尼语(果阿) 孟加拉语 孟文 客家语 宾夕法尼亚德语 宿务语 密克马克语 富拉尼语 察合台语 尼日利亚富拉语 尼泊尔语 尼瓦尔语 山地马里语 巴什基尔语 巴利语 巴厘语 巴斯克罗姆语 巴斯克语 巽他语 布列塔尼语 布里亞特語 希伯来语 希利盖农语 帕劳语 帕拉丁德语 帕皮阿门托语 平地马里语 庇卡底语 库尔德语 库梅克语 库约语 康沃尔语 弗留利语 弗里斯兰语 彝语北部方言 德伦特语 德语 德顿语 意大利语 意第绪语 扎扎语 托克劳语 托克皮辛语 拉丁国际语 拉丁语 拉丹語 拉兹语 拉帕努伊语 拉汀语 拉特加萊語 拉科塔语 拉脱维亚语 拉迪诺语 拜拜语 挪威尼诺斯克语 捷克语 提格利尼亚语 提格雷语 摩洛哥口語 摩霍克语 敘利亞語 文言文 斐济语 斐濟印地語 斯洛伐克语 斯洛文尼亚语 斯瓦希里语 新共同语言 施瓦本语 旁遮普语(东部) 旁遮普语(西部) 日语 昆雅语 明格列尔语 晋语 普什图语 曼巴语 杜顺语 林加拉语 柏柏尔语 查瓦卡诺语 查莫罗语 格羅寧根方言 格陵兰语 格雷罗纳瓦特尔语 格鲁吉亚语 桑戈语 梵语 楚克其语 楚瓦什语 欧西坦语 比斯拉马语 毛利语 毛里求斯克里奥尔语 汤加语 汤加语(赞比西) 沃拉普克语 沃洛夫语 沙维雅语 法罗语 法语 波兰语 波斯尼亚语 波斯语 泰卢固语 泰米尔语 泰语 洋泾浜英语 洪斯吕克语 海地克里奥尔语 海灣阿拉伯 湘语 满语 烏爾霍博語 爪哇语 爱尔兰语 爱沙尼亚语 牙買加土語 犹太-塔特语 犹太巴比伦尼亚阿拉米语 猶太-巴勒斯坦亞拉姆語 现代希腊语 班加語 班巴拉语 瑙鲁语 瑞典语 瑞士德语 瓜德罗普克里奥尔语 瓜拉尼语 瓦布梅托语 瓦瑞语 瓦隆语 白俄罗斯语 白苗语 皮埃蒙特语 盖丘亚语 祖鲁语 科米-彼尔米亚克语 科米-齊良語 科萨语 科西嘉语 科隆方言 立沃尼亚语 立陶宛语 米兰德斯语 米南佳保语 粤语 索马里语 约鲁巴语 纳瓦霍语 纽埃语 维吾尔语 维普森语 绿苗语 缅甸语 罗姆语 罗曼斯语 罗马尼亚语 翁本杜语 老图皮语 老挝语 聪加语 腓尼基语 舒斯瓦普语 艾米利亚语 艾马拉语 芬兰语 苏格兰盖尔语 苏格兰语 苏美尔语 英格里亞語 英语 茨瓦纳语 荷兰语 莫克沙语 萨丁语 萨摩亚语 萨特弗里斯兰语 葡萄牙语 蒙古语 薩莫吉提亞語 藏语 西班牙语 西西里语 诺盖语 诺维亚语 豪撒语 赣语 越南语 路易斯安那克里奥尔语 车臣语 辛达尔语 迈蒂利语 迪维希语 逻辑语 道本语 那瓦特语 邦板牙語 邦阿西南语 鄂温克语 里夫语 闽南语 阿依努语 阿克兰语 阿哈加尔语 阿塞拜疆语 阿姆哈拉语 阿尔及利亚阿拉伯语 阿尔巴尼亚语 阿尔巴尼亚语盖格方言 阿布哈兹语 阿弗里希利语 阿拉伯语 阿拉贡语 阿斯图里亚斯语 阿瓦乔语 阿萨姆语 阿迪格语 雅库特语 霍语 鞑靼语 韩语 马其顿语 马尔加什语 马恩语 马拉地语 马拉雅拉姆语 马来语 马绍尔语 马耳他语 马都拉语 高棉语 齐切瓦语 Unknown language
文件描述
Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
选项与结构
句子编号 [tab] 语言 [tab] 文本

Detailed Sentences

Filename

{{sentencesDetailed | filename}}

所有语言
Only sentences in: Brithenig Central Mnong Cyc项目专用语言 Dutton World Speedwords Karakhanid Kekchi (Q'eqchi') Keningau Murut Malay (Vernacular) Naga (Tangshang) Ngeq Northern Haida Nyungar South Levantine Arabic Southern Haida Southern Subanen Tagal Murut Temuan 上海话 上索布语 下索布语 世界语 东干语 中世纪法语 中世纪英语 中古西班牙語 中文普通话 中比科爾語 中瓦斯特克纳瓦特尔语 丹麦语 乌克兰语 乌兹别克语 乌尔都语 乌德穆尔特语 乔克托语 书面挪威语 亚美尼亚语 亞述新亞蘭語 伊博语 伊多语 伊拉克阿拉伯语 伊洛卡诺语 伊班语 伦迪尔语 低地德语(低地撒克逊语) 佛罗语 依善语 俄语 保加利亚语 信德语 修纳语 俾路支语 倫巴底語 僧伽罗语 克什米尔语 克文语 克林贡语 克罗地亚语 克里米亞韃靼語 冰岛语 冲绳语 切罗基语 利古里亚语 加利西亚语 加告兹语 加尔华里语 加族语 加泰罗尼亚语 匈牙利语 北弗里斯兰语 北摩鹿加群岛马来语 北方萨米语 北黎凡特阿拉伯语 匹普语 南索托语 南萨米语 南非荷兰语 博多语 博杰普尔语 卡姆巴语 卡尔梅克语 卡尤加语 卡拉卡尔帕克语 卡拉恰伊巴尔卡尔语 卡拜尔语 卡累利阿语 卡纳达语 卡舒比语 卡西语 卡达山语 卢干达语 卢森堡语 卢森尼亚语 印地语 印尼语 厄尔兹亚语 古东斯拉夫语 古亞拉姆語 古代突厥语 古吉拉特语 古希伯来语 古希腊语 古普鲁士语 古法语 古英语 古薩克森語 古诺尔斯语 史瓦濟語 吉尔伯特语 吉尔吉斯坦语 哈卡斯语 哈萨克语 哥特语 因纽特语 国际语 国际语 图瓦卢语 图瓦语 土库曼语 土耳其语 埃及阿拉伯语 埃斯特雷馬杜拉語 埃维语 基切语 基尼亚卢旺达语 基隆迪语 塔加路语 塔吉克语 塔希提语 塔罗萨语 塔雷什语 塞尔维亚语 塞舌尔克里奥尔语 夏威夷语 奇努克混合语 奥地利-巴伐利亚语 奥塞梯语 奥斯曼土耳其语 奥杰布瓦语 奥里亚语 奥里萨巴纳瓦特尔语 威尔士语 威尼斯語 孔卡尼语(果阿) 孟加拉语 孟文 客家语 宾夕法尼亚德语 宿务语 密克马克语 富拉尼语 察合台语 尼日利亚富拉语 尼泊尔语 尼瓦尔语 山地马里语 巴什基尔语 巴利语 巴厘语 巴斯克罗姆语 巴斯克语 巽他语 布列塔尼语 布里亞特語 希伯来语 希利盖农语 帕劳语 帕拉丁德语 帕皮阿门托语 平地马里语 庇卡底语 库尔德语 库梅克语 库约语 康沃尔语 弗留利语 弗里斯兰语 彝语北部方言 德伦特语 德语 德顿语 意大利语 意第绪语 扎扎语 托克劳语 托克皮辛语 拉丁国际语 拉丁语 拉丹語 拉兹语 拉帕努伊语 拉汀语 拉特加萊語 拉科塔语 拉脱维亚语 拉迪诺语 拜拜语 挪威尼诺斯克语 捷克语 提格利尼亚语 提格雷语 摩洛哥口語 摩霍克语 敘利亞語 文言文 斐济语 斐濟印地語 斯洛伐克语 斯洛文尼亚语 斯瓦希里语 新共同语言 施瓦本语 旁遮普语(东部) 旁遮普语(西部) 日语 昆雅语 明格列尔语 晋语 普什图语 曼巴语 杜顺语 林加拉语 柏柏尔语 查瓦卡诺语 查莫罗语 格羅寧根方言 格陵兰语 格雷罗纳瓦特尔语 格鲁吉亚语 桑戈语 梵语 楚克其语 楚瓦什语 欧西坦语 比斯拉马语 毛利语 毛里求斯克里奥尔语 汤加语 汤加语(赞比西) 沃拉普克语 沃洛夫语 沙维雅语 法罗语 法语 波兰语 波斯尼亚语 波斯语 泰卢固语 泰米尔语 泰语 洋泾浜英语 洪斯吕克语 海地克里奥尔语 海灣阿拉伯 湘语 满语 烏爾霍博語 爪哇语 爱尔兰语 爱沙尼亚语 牙買加土語 犹太-塔特语 犹太巴比伦尼亚阿拉米语 猶太-巴勒斯坦亞拉姆語 现代希腊语 班加語 班巴拉语 瑙鲁语 瑞典语 瑞士德语 瓜德罗普克里奥尔语 瓜拉尼语 瓦布梅托语 瓦瑞语 瓦隆语 白俄罗斯语 白苗语 皮埃蒙特语 盖丘亚语 祖鲁语 科米-彼尔米亚克语 科米-齊良語 科萨语 科西嘉语 科隆方言 立沃尼亚语 立陶宛语 米兰德斯语 米南佳保语 粤语 索马里语 约鲁巴语 纳瓦霍语 纽埃语 维吾尔语 维普森语 绿苗语 缅甸语 罗姆语 罗曼斯语 罗马尼亚语 翁本杜语 老图皮语 老挝语 聪加语 腓尼基语 舒斯瓦普语 艾米利亚语 艾马拉语 芬兰语 苏格兰盖尔语 苏格兰语 苏美尔语 英格里亞語 英语 茨瓦纳语 荷兰语 莫克沙语 萨丁语 萨摩亚语 萨特弗里斯兰语 葡萄牙语 蒙古语 薩莫吉提亞語 藏语 西班牙语 西西里语 诺盖语 诺维亚语 豪撒语 赣语 越南语 路易斯安那克里奥尔语 车臣语 辛达尔语 迈蒂利语 迪维希语 逻辑语 道本语 那瓦特语 邦板牙語 邦阿西南语 鄂温克语 里夫语 闽南语 阿依努语 阿克兰语 阿哈加尔语 阿塞拜疆语 阿姆哈拉语 阿尔及利亚阿拉伯语 阿尔巴尼亚语 阿尔巴尼亚语盖格方言 阿布哈兹语 阿弗里希利语 阿拉伯语 阿拉贡语 阿斯图里亚斯语 阿瓦乔语 阿萨姆语 阿迪格语 雅库特语 霍语 鞑靼语 韩语 马其顿语 马尔加什语 马恩语 马拉地语 马拉雅拉姆语 马来语 马绍尔语 马耳他语 马都拉语 高棉语 齐切瓦语 Unknown language
文件描述
Contains additional fields for each sentence (owner name, date created/modified).
选项与结构
句子编号 [tab] 语言 [tab] 文本 [tab] 用户名 [tab] 添加日期 [tab] 最后修改

Base of Sentences

Filename
sentences_base.tar.bz2
文件描述
A sentence is based on another if it has been initially added as a translation. Each sentence is associated with a base, which can be:
  • zero: The sentence is original, not based on another.
  • greater than 0: The sentence id it is based upon.
  • \N: We do not know. This is rare but we have a handful of sentences for which we do not know if they have been added as translations or not.
选项与结构
句子编号 [tab] Base of the sentence

Sentences (CC0)

Filename

{{sentencesCC0 | filename}}

所有语言
Only sentences in: Brithenig Nyungar South Levantine Arabic 世界语 中世纪英语 中古西班牙語 丹麦语 乌克兰语 书面挪威语 伊多语 俄语 克文语 克林贡语 冰岛语 利古里亚语 加泰罗尼亚语 匈牙利语 北黎凡特阿拉伯语 卡拜尔语 卡累利阿语 古亞拉姆語 古英语 国际语 国际语 土耳其语 埃及阿拉伯语 塔罗萨语 希伯来语 德语 意大利语 意第绪语 拉丁国际语 拉丁语 拉丹語 拉迪诺语 捷克语 文言文 新共同语言 昆雅语 柏柏尔语 沃拉普克语 沙维雅语 法语 波兰语 犹太巴比伦尼亚阿拉米语 白俄罗斯语 粤语 腓尼基语 芬兰语 英格里亞語 英语 荷兰语 葡萄牙语 西班牙语 诺维亚语 辛达尔语 逻辑语 道本语 阿拉伯语 Unknown language
文件描述
Contains all the sentences available under CC0.
选项与结构
句子编号 [tab] 语言 [tab] 文本 [tab] 最后修改

链接

Filename
links.tar.bz2
文件描述
Contains the links between the sentences. 1 [tab] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [tab] 1.
选项与结构
句子编号 [tab] 翻译 ID

标签

Filename
tags.tar.bz2
文件描述
Contains the list of tags associated with each sentence. 381279 [tab] proverb means that sentence #381279 has been assigned the "proverb" tag.
选项与结构
句子编号 [tab] 标签名称

列表

Filename
user_lists.tar.bz2
文件描述
Contains the list of sentence lists.
选项与结构
列表编号 [tab] 用户名 [tab] 创建日期 [tab] 最后修改 [tab] 列表名称 [tab] Editable by

列表中的句子

Filename
sentences_in_lists.tar.bz2
文件描述
Indicates the sentences that are contained by any lists. 13 [tab] 381279 means that sentence #381279 is contained by the list that has an id of 13.
选项与结构
列表编号 [tab] 句子编号

Japanese indices

Filename
jpn_indices.tar.bz2
文件描述
Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. 句子编号 refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
选项与结构
句子编号 [tab] Meaning id [tab] 文本

带音频的句子

Filename
sentences_with_audio.tar.bz2
文件描述
Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
选项与结构
句子编号 [tab] 用户名 [tab] License [tab] Attribution URL

User skill level per language

Filename
user_languages.tar.bz2
文件描述
Indicates the self-reported skill levels of members in individual languages.
选项与结构
语言 [tab] Skill level [tab] 用户名 [tab] Details

Users' sentence reviews

Filename
users_sentences.csv
文件描述
Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
选项与结构
用户名 [tab] 语言 [tab] 句子编号 [tab] 审阅 [tab] 添加日期 [tab] 最后修改

Transcriptions

Filename

{{transcriptions | filename}}

所有语言
Only sentences in: 中文普通话 乌兹别克语 日语 粤语
文件描述
Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
选项与结构
句子编号 [tab] 语言 [tab] Script name [tab] 用户名 [tab] Transcription