노트
여기에서 찾을 수 있는 데이터는 언어 도구나 데이터를 처리하는 프로그램을 코딩하는 데 쓰이지 않는 이상 유용하진 않을 거예요.
단순히 언어를 배우고 싶어서 문장이 필요한 것이라면, 문장 리스트를 확인해 보세요. 스스로 리스트를 만들거나 또는 다른 사람이 이미 만든 것을 볼 수 있아요. 그 리스트는 다운로드하거나 인쇄할 수 있어요.
여기에 있는 파일에 대한 일반 정보
많은 일본어나 영어 문장들은 공공 도메인의 Tanaka Corpus에서 왔어요.
Creative commons
These files are released under CC BY 2.0 FR.

A part of our sentences are also available under CC0 1.0.

Licenses covering audio
The license covering an audio file is chosen by the contributor, and is indicated on the page that lists the audio files that he or she has contributed.
질문이 있나요?
If you have questions or requests, feel free to contact us. In general, we answer quickly.
다운로드
Use this tool to generate and download customized exports on demand.
Download all sentences in language A that are translated into language B, along with the translations.
문장들
- Filename
-
모든 언어 Only sentences in: 가가우스어 가어 갈리시아어 고대 그리스어 고대 노르웨이어 고대 동슬라브어 고대 영어 고대 작센어 고대 프랑스어 고대 프로이센어 고대 프리지아어 고지 소르비아어 고트어 과들루프 크리올 과라니어 구자라트어 굴프 아랍어 그루지아어 그리스어 그린란드어 꿰냐 나바호어 나우루어 나폴리어 남부 사미어 남부 소토어 남부 알타이어 남부 쿠르드어 남부 하이다어 네덜란드어 네와르어 네팔어 노가이어 노르웨이 뉘노르스크어 노르웨이어 노비알 누에르어 니웨언어 덴마크어 독일어 동프리슬란트어 둥간어 디베히어 라디노어 라딘어 라아단 라오어 라즈어 라코타어 라트갈레어 라트비아어 라틴어 라파누이어 러시아어 로만시어 로지반어 로힝야어 롬바르디아어 롬어 루간다어 루마니아어 루신어 루이지애나 크리올어 룩셈부르크어 르완다어 리구리아어 리브어 리비아 아랍어 리투아니아어 림버거어 링갈라어 링구아 프랑카 노바 마니푸르어 마두라어 마라티어 마셜어 마오리어 마이틸리어 마케도니아어 마푸둥군어 만주어 말라가시어 말라얄람어 말레이시아어 맹크스어 모로코 아랍어 모리스얀어 모크샤어 모호크어 몬어 몰타어 몽골어 미낭카바우어 미란데어 미크맥어 민그렐어 바슈키르어 바스크어 반자르어 발루치어 발리어 밤바라어 뱅골어 버로어 버마어 베네토어 베르베르어 베트남어 벨라루스어 벱스어 보도어 보스니아어 볼라퓌크어 부랴트어 북부 사미어 북프리슬란트어 불가리아어 브르타뉴어 브리터니그 비슬라마어 빠따니 말레이어 사라이키어 사르디니아어 사모기티아어 사모아어 산고어 산스크리트어 산탈리어 상하이어 서아르메니아어 세르비아어 세부아노어 세이셸 크리올 소말리아어 쇼나어 수메르어 순다어 슈바벤어 스라난 통가어 스리랑카어 스와티어 스와힐리어 스웨덴어 스위스 독일어 스코틀랜드 게일어 스코틀랜드어 스페인어 슬로바키아어 슬로베니아어 시리아어 시칠리아어 신다린 신디어 실레지아어 실헤티어 아디게어 아라곤어 아랍어 아바르어 아바자어 아삼어 아스투리아어 아와히어 아이누어 아이마라어 아이슬란드어 아이티어 아일랜드어 아제르바이잔어 아클라논어 아프리카어 아프리힐리어 알바니아어 알제리 아랍어 암하라어 압하지야어 야쿠트어 에로민첼라어 에밀리아어 에스토니아어 에스트레마두라어 에스페란토어 에웨어 엘즈야어 영어 예벤키어 오세트어 오스만 터키어 오스트로바이에른어 오지브와어 오크어 오키나와어 와라이어 왈론어 요루바어 우드말트어 우르두어 우압메토어 우즈벡어 우크라이나어 움분두어 월로프어 웨일스어 위구르어 유대인 바빌로니아 아람어 유카텍어 이그보어 이눅티투트어 이도어 이디시어 이라크 아랍어 이반어 이산어 이어 이집트 아랍어 이탈리아어 인도네시아어 인테르링구아 인테르링구에 일로카노어 일본어 잉그리아어 자메이카 크리올 자바어 자자어 저지 독일어 (저지 작센) 저지 소르비아어 제일란트어 줄루어 중국 간어 중국 광둥어 중국 만다린어 중국 문어 중국 민난어 중국 샹어 중국 하카어 중부 비콜어 중세 영어 중세 프랑스어 진어 차가타이어 차모르어 차바카노어 체로키어 체첸어 체코어 촉토어 총가어 추바시어 축치어 치누크 자곤 카라챠이-발카르어 카라칼파크어 카렐리야어 카바르디어 카슈미르어 카슈비아어 카슈카이어 카시어 카유가어 카자흐어 카탈로니아어 카팜팡안 어 칸나다어 칼라지어 칼미크어 캄바어 커바일어 케추아어 코르시카어 코미지리안어 코미페르먀크어 코사어 코타바 콘월어 콩고 스와힐리어 쾰른어 쿠믹어 크로아티아어 크림 타타르어 크메르어 클링온어 키룬디어 키르기스어 키리바시어 타갈로그 어 타밀어 타지크어 타타르어 타히티어 탈로사어 탈리쉬어 태국어 터키어 텔루구어 토켈라우어 토크 피신어 토키 포나어 통가어 투르크멘어 투발루어 투비니안어 툼부카어 티그레어 티그리냐어 티베트어 파슈토어 파피아먼토어 판가시난어 팔라우어 팔리어 페니키아어 페로어 페르시아어 펜실베이니아 독일어 평원 크리어 포르투갈어 폴란드어 표준 모로코 타마지트어 프랑스어 프리울리어 프리지아어 피에몬테어 피지 힌디어 피지어 피카르디어 피필어 핀란드어 하와이어 하우사어 하이다어 하카스어 한국어 헝가리어 헤리가뇬어 호어 호즈푸리어 히브리어 힌디어 Ancient Hebrew Ao Naga Assyrian Neo-Aramaic Baybayanon Berom Central Dusun Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan Cuyonon CycL Drents Dutton World Speedwords Eastern Armenian Garhwali Gheg Albanian Gronings Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Keningau Murut Konkani (Goan) Kven Finnish Lezgi Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Meadow Mari Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nigerian Fulfulde North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Nyungar O'odham Odia (Oriya) Old Aramaic Old Spanish Old Turkish Orizaba Nahuatl Palatine German Pulaar Punjabi (Eastern) Punjabi (Western) Rendille Setswana Shuswap South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Svan Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Tashelhit Temuan Tetun Tonga (Zambezi) Tupinambá Urhobo Wayuu West-Central Oromo 미확인 언어 - 파일 설명
- Contains all the sentences in the selected language. Each sentence is associated with a unique id and an ISO 639-3 language code.
- Fields and structure
- Sentence id [탭] Lang [탭] 글
Detailed Sentences
- Filename
-
{{sentencesDetailed | filename}}
모든 언어 Only sentences in: 가가우스어 가어 갈리시아어 고대 그리스어 고대 노르웨이어 고대 동슬라브어 고대 영어 고대 작센어 고대 프랑스어 고대 프로이센어 고대 프리지아어 고지 소르비아어 고트어 과들루프 크리올 과라니어 구자라트어 굴프 아랍어 그루지아어 그리스어 그린란드어 꿰냐 나바호어 나우루어 나폴리어 남부 사미어 남부 소토어 남부 알타이어 남부 쿠르드어 남부 하이다어 네덜란드어 네와르어 네팔어 노가이어 노르웨이 뉘노르스크어 노르웨이어 노비알 누에르어 니웨언어 덴마크어 독일어 동프리슬란트어 둥간어 디베히어 라디노어 라딘어 라아단 라오어 라즈어 라코타어 라트갈레어 라트비아어 라틴어 라파누이어 러시아어 로만시어 로지반어 로힝야어 롬바르디아어 롬어 루간다어 루마니아어 루신어 루이지애나 크리올어 룩셈부르크어 르완다어 리구리아어 리브어 리비아 아랍어 리투아니아어 림버거어 링갈라어 링구아 프랑카 노바 마니푸르어 마두라어 마라티어 마셜어 마오리어 마이틸리어 마케도니아어 마푸둥군어 만주어 말라가시어 말라얄람어 말레이시아어 맹크스어 모로코 아랍어 모리스얀어 모크샤어 모호크어 몬어 몰타어 몽골어 미낭카바우어 미란데어 미크맥어 민그렐어 바슈키르어 바스크어 반자르어 발루치어 발리어 밤바라어 뱅골어 버로어 버마어 베네토어 베르베르어 베트남어 벨라루스어 벱스어 보도어 보스니아어 볼라퓌크어 부랴트어 북부 사미어 북프리슬란트어 불가리아어 브르타뉴어 브리터니그 비슬라마어 빠따니 말레이어 사라이키어 사르디니아어 사모기티아어 사모아어 산고어 산스크리트어 산탈리어 상하이어 서아르메니아어 세르비아어 세부아노어 세이셸 크리올 소말리아어 쇼나어 수메르어 순다어 슈바벤어 스라난 통가어 스리랑카어 스와티어 스와힐리어 스웨덴어 스위스 독일어 스코틀랜드 게일어 스코틀랜드어 스페인어 슬로바키아어 슬로베니아어 시리아어 시칠리아어 신다린 신디어 실레지아어 실헤티어 아디게어 아라곤어 아랍어 아바르어 아바자어 아삼어 아스투리아어 아와히어 아이누어 아이마라어 아이슬란드어 아이티어 아일랜드어 아제르바이잔어 아클라논어 아프리카어 아프리힐리어 알바니아어 알제리 아랍어 암하라어 압하지야어 야쿠트어 에로민첼라어 에밀리아어 에스토니아어 에스트레마두라어 에스페란토어 에웨어 엘즈야어 영어 예벤키어 오세트어 오스만 터키어 오스트로바이에른어 오지브와어 오크어 오키나와어 와라이어 왈론어 요루바어 우드말트어 우르두어 우압메토어 우즈벡어 우크라이나어 움분두어 월로프어 웨일스어 위구르어 유대인 바빌로니아 아람어 유카텍어 이그보어 이눅티투트어 이도어 이디시어 이라크 아랍어 이반어 이산어 이어 이집트 아랍어 이탈리아어 인도네시아어 인테르링구아 인테르링구에 일로카노어 일본어 잉그리아어 자메이카 크리올 자바어 자자어 저지 독일어 (저지 작센) 저지 소르비아어 제일란트어 줄루어 중국 간어 중국 광둥어 중국 만다린어 중국 문어 중국 민난어 중국 샹어 중국 하카어 중부 비콜어 중세 영어 중세 프랑스어 진어 차가타이어 차모르어 차바카노어 체로키어 체첸어 체코어 촉토어 총가어 추바시어 축치어 치누크 자곤 카라챠이-발카르어 카라칼파크어 카렐리야어 카바르디어 카슈미르어 카슈비아어 카슈카이어 카시어 카유가어 카자흐어 카탈로니아어 카팜팡안 어 칸나다어 칼라지어 칼미크어 캄바어 커바일어 케추아어 코르시카어 코미지리안어 코미페르먀크어 코사어 코타바 콘월어 콩고 스와힐리어 쾰른어 쿠믹어 크로아티아어 크림 타타르어 크메르어 클링온어 키룬디어 키르기스어 키리바시어 타갈로그 어 타밀어 타지크어 타타르어 타히티어 탈로사어 탈리쉬어 태국어 터키어 텔루구어 토켈라우어 토크 피신어 토키 포나어 통가어 투르크멘어 투발루어 투비니안어 툼부카어 티그레어 티그리냐어 티베트어 파슈토어 파피아먼토어 판가시난어 팔라우어 팔리어 페니키아어 페로어 페르시아어 펜실베이니아 독일어 평원 크리어 포르투갈어 폴란드어 표준 모로코 타마지트어 프랑스어 프리울리어 프리지아어 피에몬테어 피지 힌디어 피지어 피카르디어 피필어 핀란드어 하와이어 하우사어 하이다어 하카스어 한국어 헝가리어 헤리가뇬어 호어 호즈푸리어 히브리어 힌디어 Ancient Hebrew Ao Naga Assyrian Neo-Aramaic Baybayanon Berom Central Dusun Central Huasteca Nahuatl Central Kanuri Central Kurdish (Soranî) Central Mnong Chinese Pidgin English Chinyanja Coastal Kadazan Cuyonon CycL Drents Dutton World Speedwords Eastern Armenian Garhwali Gheg Albanian Gronings Guerrero Nahuatl Gun Hill Mari Hitchiti Hmong Daw (White) Hmong Njua (Green) Hunsrik Interglossa Interslavic Jewish Palestinian Aramaic Juhuri (Judeo-Tat) K'iche' Karakhanid Kekchi (Q'eqchi') Keningau Murut Konkani (Goan) Kven Finnish Lezgi Lushootseed Mahasu Pahari Malay (Vernacular) Mambae Mandar Meadow Mari Middle Persian (Pahlavi) Mono (USA) Muskogee (Creek) Naga (Tangshang) Nahuatl Nande Ngeq Nigerian Fulfulde North Levantine Arabic North Moluccan Malay Northern Kurdish (Kurmancî) Northern Zaza (Kirmanjki) Nyungar O'odham Odia (Oriya) Old Aramaic Old Spanish Old Turkish Orizaba Nahuatl Palatine German Pulaar Punjabi (Eastern) Punjabi (Western) Rendille Setswana Shuswap South Levantine Arabic Southern Subanen Southern Zaza (Dimli) Svan Tachawit Tagal Murut Tahaggart Tamahaq Tarifit Tashelhit Temuan Tetun Tonga (Zambezi) Tupinambá Urhobo Wayuu West-Central Oromo 미확인 언어 - 파일 설명
- Contains additional fields for each sentence (owner name, date created/modified).
- Fields and structure
- Sentence id [탭] Lang [탭] 글 [탭] 사용자 이름 [탭] 추가된 날짜 [탭] 가장 최근에 변경된 날짜
Original and Translated Sentences
- Filename
- sentences_base.tar.bz2
- 파일 설명
-
Each sentence is listed as original or a translation of another. The "base" field can have the following values:
- zero: The sentence is original, not a translation of another.
- greater than zero: The id of the sentence from which it was translated.
- \N: Unknown (rare).
- Fields and structure
- Sentence id [탭] Base field
문장들 (CC0)
- Filename
-
모든 언어 Only sentences in: 고대 그리스어 고대 노르웨이어 고대 프리지아어 네덜란드어 노르웨이어 덴마크어 독일어 라디노어 라아단 라틴어 러시아어 리구리아어 뱅골어 베르베르어 벨라루스어 볼라퓌크어 산탈리어 스웨덴어 스페인어 실헤티어 아랍어 알제리 아랍어 에스페란토어 영어 우크라이나어 웨일스어 유대인 바빌로니아 아람어 이도어 이디시어 이탈리아어 인테르링구아 인테르링구에 일본어 중국 광둥어 중국 만다린어 중국 문어 중세 영어 체코어 카렐리야어 카탈로니아어 커바일어 클링온어 토키 포나어 페니키아어 포르투갈어 폴란드어 표준 모로코 타마지트어 프랑스어 핀란드어 헝가리어 호어 히브리어 힌디어 Ancient Hebrew Jewish Palestinian Aramaic Konkani (Goan) Kven Finnish Nyungar Odia (Oriya) Old Aramaic Tachawit 미확인 언어 - 파일 설명
- Contains all the sentences available under CC0.
- Fields and structure
- Sentence id [탭] Lang [탭] 글 [탭] 가장 최근에 변경된 날짜
Links
- Filename
- links.tar.bz2
- 파일 설명
- Contains the links between the sentences. 1 [탭] 77 means that sentence #77 is the translation of sentence #1. The reciprocal link is also present, so the file will also contain a line that says 77 [탭] 1.
- Fields and structure
- Sentence id [탭] Translation id
태그
- Filename
- tags.tar.bz2
- 파일 설명
- Contains the list of tags associated with each sentence. 381279 [탭] proverb means that sentence #381279 has been assigned the "proverb" tag.
- Fields and structure
- Sentence id [탭] 태그 이름
리스트
- Filename
- user_lists.tar.bz2
- 파일 설명
- Contains the list of sentence lists.
- Fields and structure
- 리스트 아이디 [탭] 사용자 이름 [탭] 생성된 날짜 [탭] 가장 최근에 변경된 날짜 [탭] 리스트 이름 [탭] Editable by
Sentences in lists
- Filename
- sentences_in_lists.tar.bz2
- 파일 설명
- Indicates the sentences that are contained by any lists. 13 [탭] 381279 means that sentence #381279 is contained by the list that has an id of 13.
- Fields and structure
- 리스트 아이디 [탭] Sentence id
Japanese indices
- Filename
- jpn_indices.tar.bz2
- 파일 설명
- Contains the equivalent of the "B lines" in the Tanaka Corpus file distributed by Jim Breen. See this page for the format. Each entry is associated with a pair of Japanese/English sentences. Sentence id refers to the id of the Japanese sentence. Meaning id refers to the id of the English sentence.
- Fields and structure
- Sentence id [탭] Meaning id [탭] 글
오디오가 있는 문장
- Filename
- sentences_with_audio.tar.bz2
- 파일 설명
- Contains the ids of the sentences, in all languages, for which audio is available. Other fields indicate who recorded the audio, its license and a URL to attribute the author. If the license field is empty, you may not reuse the audio outside the Tatoeba project.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Fields and structure
- Sentence id [탭] Audio id [탭] 사용자 이름 [탭] 라이센스 [탭] Attribution URL
언어에 따른 레벨
- Filename
- user_languages.tar.bz2
- 파일 설명
- Indicates the self-reported skill levels of members in individual languages.
- Fields and structure
- Lang [탭] 숙련도 [탭] 사용자 이름 [탭] 세부 사항
사용자의 문장 리뷰
- Filename
- users_sentences.csv
- 파일 설명
- Contains sentences reviewed by users. The value of the review can be -1 (sentence not OK), 0 (undecided or unsure), or 1 (sentence OK). Warning: this data is still experimental.
- Fields and structure
- 사용자 이름 [탭] Sentence id [탭] 리뷰 [탭] 추가된 날짜 [탭] 가장 최근에 변경된 날짜
필사
- Filename
-
모든 언어 Only sentences in: 우즈벡어 일본어 중국 광둥어 중국 만다린어 - 파일 설명
- Contains all transcriptions in auxiliary or alternative scripts. A username associated with a transcription indicates the user who last reviewed and possibly modified it. A transcription without a username has not been marked as reviewed. The script name is defined according to the ISO 15924 standard.
- Fields and structure
- Sentence id [탭] Lang [탭] Script name [탭] 사용자 이름 [탭] Transcription