clear
{{language.name}} Язык не найден.
swap_horiz
{{language.name}} Язык не найден.
search

Примечание

Данные, которые вы найдете здесь, НЕ будут вам полезны, если только вы не занимаетесь программированием языковых инструментов или обработкой данных.

Если вам нужны предложения для изучения какого-либо языка, воспользуйтесь списками предложений. Вы можете создать собственный список или просматривать списки, созданные другими участниками. Списки также можно загружать и распечатывать.

Общая информация о файлах

Представленные здесь файлы обновляются каждую субботу в 6:30 (UTC)

Многие японские и английские предложения взяты из Корпуса Танаки, являющегося общественным достоянием.

Creative commons

Эти файлы доступны по лицензии CC BY 2.0 FR.

Creative Commons License CC-BY

Часть наших предложений также доступна по CC0 1.0

Creative Commons License CC0

Лицензии, под которыми доступно аудио

Лицензия, на условиях которой возможно использование аудиофайла, выбирается автором и отображается на странице списка аудиофайлов, добавленных этим автором.

Есть вопросы?

Если у вас есть просьбы или вопросы, пожалуйста обращайтесь к нам. Обычно мы отвечаем быстро.

Загрузки

Предложения

Имя файла

{{sentences | filename}}

все языки
Только предложения на: абхазский авадхи адыгейский азербайджанский аймара айнский акланонский албанский амхарский английский арабский арабский (алжирский) арабский (египетский) арабский (иракский) арабский (марокканский) арабский (сиро-палестинский) арабский Персидского залива арагонский армянский ассамский ассирийский новоарамейский астурийский африкаанс африхили ахаггар баварский байбайский балийский бамана банджарский баскский башкирский белорусский белохмонгский бенгальский берберский береговой кадазанский бирманский бислама бодо болгарский боснийский бретонский бритениг бурятский бходжпури вавилонский иудейско-арамейский валлийский валлонский варайский венгерский венетский вепсский верхнелужицкий волапюк волоф выруский вьетнамский га гавайский гагаузский гаитянский креольский галисийский гархвали гваделупский креольский гегский албанский геррерский науатль горномарийский горско-еврейский готский гренландский греческий гронингенское наречие грузинский гуарани гуджарати гэльский датский диалекты Дренте древнеанглийский древнегреческий древнерусский дунганский жемайтский зазаки затерландский фризский зелёнохмонгский зулусский ибанский иврит игбо идиш идо ижорский илоканский индонезийский интерлингва интерлингве инуктитут ирландский Исанский язык исландский испанский итальянский йоруба кабильский казахский кайюга калмыцкий камба каннада кантонский капампанганский каракалпакский карачаево-балкарский карельский каталанский кашмирский кашубский квенский квенья кебуано кекчи (Qʼeqchiʼ) кёльнский диалект кенингау-мурут кечуа киньяруанда киргизский кирибати китайский (гань) китайский (сян) китайский (хакка) китайский (южноминьский) китайский пиджин-инглиш киче классический китайский клингонский коми-зырянский коми-пермяцкий конкани (гоанский) корейский корнский корсиканский коса котава крымскотатарский куйонон кумыкский курдский кхаси кхмерский лаадан ладинский лазский лакота лаосский латгальский латинский латышский ливский лигурийский лингала лингва франка нова литовский ложбан ломбардский луганда луговомарийский луизианский креольский люксембургский маврикийский креольский мадурский майтили македонский малагасийский малайский малайский (разговорный) малаялам мальдивский мальтийский мамбай маньчжурский маори маратхи маршалльский мегрельский язык микмакский минангкабау мирандский могаукский мокшанский монгольский монский мэнский навахо науатль науруанский нгек Невари немецкий непальский нигерийский фула нидерландский нижнелужицкий нижненемецкий (нижнесаксонский) ниуэ новиаль ногайский норвежский букмол норвежский нюношк носу ньянджа нюнгар оджибве окинавский окситанский орисабский науатль ория (одиа) осетинский османский османский палауский Палестинский иудейско-арамейский пангасинанский папьяменто пенджаби (восточный) пенджаби (западный) пенсильванско-немецкий диалект пикардский пипиль польский португальский прусский пушту пфальцский пьемонтский рапануйский рендилле ретороманский рифский румынский рунди русинский русский самоанский санго санскрит сардинский свати севернокитайский северносаамский севернофризский северо-молуккский малайский сейшельский креольский сербский сесото сефардский сингальский синдарин синдхи сирийский сицилийский скоропись Даттона словацкий словенский сомалийский среднеанглийский среднефранцузский староарамейский староиспанский язык старонорвежский старосаксонский старофранцузский суахили сунданский тагал-мурут тагальский таджикский таитянский тайский талосский талышский тамильский тасе-нага татарский телугу темуанский тетум тибетский тигре тигринья ток-писин токелау токипона Тонга (Замбези) тонганский тсвана тсонга тувалу тувинский тупи турецкий туркменский уаб-мето удмуртский узбекский уйгурский украинский умбунду урду урхобо фарерский фарси фиджийский фиджийский хинди Финикийский финский французский фризский фриульский фула хакасский хауса хилигайнон хинди хо хорватский хунсрюк центрально-уастеканский науатль центральный бикольский центральный дусунский центральный мнонг Цзинь цыганский чабакано чагатайский чаморро чероки чеченский чешский чоктавский чувашский чукотский шанхайский шауйа швабский шведский швейцарский немецкий шона шотландский шумерский шусвап эве эвенкийский эмилианский эрзянский эрроминчела эсперанто эстонский эстремадурский южносаамский яванский язык CycL якутский ямайский креольский японский Неизвестный язык
Описание файла
Содержит все предложения в выбранном языке. Каждое предложение ассоциировано с уникальным идентификатором и языковым кодом ISO 639-3.
Поля и структуры
ID предложения [tab] Язык [tab] Текст

Предложения с деталями

Имя файла

{{sentencesDetailed | filename}}

все языки
Только предложения на: абхазский авадхи адыгейский азербайджанский аймара айнский акланонский албанский амхарский английский арабский арабский (алжирский) арабский (египетский) арабский (иракский) арабский (марокканский) арабский (сиро-палестинский) арабский Персидского залива арагонский армянский ассамский ассирийский новоарамейский астурийский африкаанс африхили ахаггар баварский байбайский балийский бамана банджарский баскский башкирский белорусский белохмонгский бенгальский берберский береговой кадазанский бирманский бислама бодо болгарский боснийский бретонский бритениг бурятский бходжпури вавилонский иудейско-арамейский валлийский валлонский варайский венгерский венетский вепсский верхнелужицкий волапюк волоф выруский вьетнамский га гавайский гагаузский гаитянский креольский галисийский гархвали гваделупский креольский гегский албанский геррерский науатль горномарийский горско-еврейский готский гренландский греческий гронингенское наречие грузинский гуарани гуджарати гэльский датский диалекты Дренте древнеанглийский древнегреческий древнерусский дунганский жемайтский зазаки затерландский фризский зелёнохмонгский зулусский ибанский иврит игбо идиш идо ижорский илоканский индонезийский интерлингва интерлингве инуктитут ирландский Исанский язык исландский испанский итальянский йоруба кабильский казахский кайюга калмыцкий камба каннада кантонский капампанганский каракалпакский карачаево-балкарский карельский каталанский кашмирский кашубский квенский квенья кебуано кекчи (Qʼeqchiʼ) кёльнский диалект кенингау-мурут кечуа киньяруанда киргизский кирибати китайский (гань) китайский (сян) китайский (хакка) китайский (южноминьский) китайский пиджин-инглиш киче классический китайский клингонский коми-зырянский коми-пермяцкий конкани (гоанский) корейский корнский корсиканский коса котава крымскотатарский куйонон кумыкский курдский кхаси кхмерский лаадан ладинский лазский лакота лаосский латгальский латинский латышский ливский лигурийский лингала лингва франка нова литовский ложбан ломбардский луганда луговомарийский луизианский креольский люксембургский маврикийский креольский мадурский майтили македонский малагасийский малайский малайский (разговорный) малаялам мальдивский мальтийский мамбай маньчжурский маори маратхи маршалльский мегрельский язык микмакский минангкабау мирандский могаукский мокшанский монгольский монский мэнский навахо науатль науруанский нгек Невари немецкий непальский нигерийский фула нидерландский нижнелужицкий нижненемецкий (нижнесаксонский) ниуэ новиаль ногайский норвежский букмол норвежский нюношк носу ньянджа нюнгар оджибве окинавский окситанский орисабский науатль ория (одиа) осетинский османский османский палауский Палестинский иудейско-арамейский пангасинанский папьяменто пенджаби (восточный) пенджаби (западный) пенсильванско-немецкий диалект пикардский пипиль польский португальский прусский пушту пфальцский пьемонтский рапануйский рендилле ретороманский рифский румынский рунди русинский русский самоанский санго санскрит сардинский свати севернокитайский северносаамский севернофризский северо-молуккский малайский сейшельский креольский сербский сесото сефардский сингальский синдарин синдхи сирийский сицилийский скоропись Даттона словацкий словенский сомалийский среднеанглийский среднефранцузский староарамейский староиспанский язык старонорвежский старосаксонский старофранцузский суахили сунданский тагал-мурут тагальский таджикский таитянский тайский талосский талышский тамильский тасе-нага татарский телугу темуанский тетум тибетский тигре тигринья ток-писин токелау токипона Тонга (Замбези) тонганский тсвана тсонга тувалу тувинский тупи турецкий туркменский уаб-мето удмуртский узбекский уйгурский украинский умбунду урду урхобо фарерский фарси фиджийский фиджийский хинди Финикийский финский французский фризский фриульский фула хакасский хауса хилигайнон хинди хо хорватский хунсрюк центрально-уастеканский науатль центральный бикольский центральный дусунский центральный мнонг Цзинь цыганский чабакано чагатайский чаморро чероки чеченский чешский чоктавский чувашский чукотский шанхайский шауйа швабский шведский швейцарский немецкий шона шотландский шумерский шусвап эве эвенкийский эмилианский эрзянский эрроминчела эсперанто эстонский эстремадурский южносаамский яванский язык CycL якутский ямайский креольский японский Неизвестный язык
Описание файла
Содержит дополнительные поля для каждого предложения (имя владельца, дату создания/изменения).
Поля и структуры
ID предложения [tab] Язык [tab] Текст [tab] Имя пользователя [tab] Дата добавления [tab] Дата последней модификации

Base of Sentences

Имя файла
sentences_base.tar.bz2
Описание файла
A sentence is based on another if it has been initially added as a translation. Each sentence is associated with a base, which can be:
  • zero: The sentence is original, not based on another.
  • greater than 0: The sentence id it is based upon.
  • \N: We do not know. This is rare but we have a handful of sentences for which we do not know if they have been added as translations or not.
Поля и структуры
ID предложения [tab] Base of the sentence

Предложения (CC0)

Имя файла

{{sentencesCC0 | filename}}

все языки
Только предложения на: английский арабский арабский (египетский) арабский (сиро-палестинский) белорусский берберский бритениг вавилонский иудейско-арамейский венгерский волапюк датский иврит идиш идо ижорский интерлингва интерлингве исландский испанский итальянский кабильский кантонский карельский каталанский квенский классический китайский клингонский латинский лигурийский лингва франка нова ложбан немецкий нидерландский новиаль норвежский букмол нюнгар польский португальский русский сефардский синдарин среднеанглийский староарамейский талосский токипона турецкий украинский Финикийский финский французский чешский шауйа эсперанто Неизвестный язык
Описание файла
Содержит все предложения, доступные под лицензией CC0.
Поля и структуры
ID предложения [tab] Язык [tab] Текст [tab] Дата последней модификации

Связи

Имя файла
links.tar.bz2
Описание файла
Содержит связи между предложениями. 1 [tab] 77 означает, что предложение №77 является переводом предложения №1. Обратная связь также присутствует, т.е. файл также содержит запись 77 [tab] 1.
Поля и структуры
ID предложения [tab] ID перевода

Теги

Имя файла
tags.tar.bz2
Описание файла
Содержит список тегов, ассоциированных с каждым предложением. 381279 [tab] proverb означает, что предложение №381279 помечено тегом «proverb».
Поля и структуры
ID предложения [tab] Название тега

Списки

Имя файла
user_lists.tar.bz2
Описание файла
Содержит список списков предложений.
Поля и структуры
ID списка [tab] Имя пользователя [tab] Дата создания [tab] Дата последней модификации [tab] Название списка [tab] Может редактироваться

Предложения в списках

Имя файла
sentences_in_lists.tar.bz2
Описание файла
Содержит предложения, находящиеся в каком-либо списке. 13 [tab] 381279 означает, что предложение №381279 находится в списке с идентификатором 13.
Поля и структуры
ID списка [tab] ID предложения

Индексы к японским предложениям

Имя файла
jpn_indices.tar.bz2
Описание файла
Содержит эквиваленты так называемых «B lines» корпуса Танаки, распространяемых Джимом Брином. С форматом можно ознакомиться на этой странице. Каждая запись ассоциирована с японско-английской парой предложений. ID предложения ссылается на идентификатор японского предложения, а ID значения — на идентификатор английского.
Поля и структуры
ID предложения [tab] ID значения [tab] Текст

Озвученные предложения

Имя файла
sentences_with_audio.tar.bz2
Описание файла
Содержит идентификаторы предложений, для которых доступно аудио. Другие поля показывают, кто записал аудио, лицензию и ссылку, с помощью которой можно сослаться на автора. Если поле лицензии пусто, вы не можете повторно использовать данное аудио вне проекта Tatoeba.
Поля и структуры
ID предложения [tab] Имя пользователя [tab] Лицензия [tab] Ссылка на источник

Уровень владения языками

Имя файла
user_languages.tar.bz2
Описание файла
Содержит данные об уровнях владения языками, указанными пользователями в профилях.
Поля и структуры
Язык [tab] Уровень владения [tab] Имя пользователя [tab] Подробности

Пользовательские проверки предложений

Имя файла
users_sentences.csv
Описание файла
Содержит предложения, проверенные пользователями. Результат проверки может принимать следующие значения: -1 (предложение не одобрено), 0 («не уверен» или «не решил») и 1 (предложение одобрено). Предупреждение: данные проверок всё ещё относятся к категории экспериментальных.
Поля и структуры
Имя пользователя [tab] Язык [tab] ID предложения [tab] Проверка [tab] Дата добавления [tab] Дата последней модификации

Транскрипции

Имя файла

{{transcriptions | filename}}

все языки
Только предложения на: кантонский севернокитайский узбекский японский
Описание файла
Содержит все текстовые расшифровки во вспомогательных или альтернативных письменностях. Имя пользователя, связанное с расшифровкой, указывает на пользователя, который в последний раз просматривал и, возможно, изменил ее. Транскрипция без имени пользователя не была помечена как проверенная. Название письменности определяется согласно стандарту ISO 15924.
Поля и структуры
ID предложения [tab] Язык [tab] Название письменности [tab] Имя пользователя [tab] Транскрипция