clear
{{language.name}} Nenhum idioma encontrado.
swap_horiz
{{language.name}} Nenhum idioma encontrado.
search

Nota

Os dados que você encontrará aqui NÃO lhe serão úteis a menos que você esteja programando uma ferramenta linguística ou trabalhando com precessamento de dados.

Se você só estiver interessado em frases que podem lhe ser úteis no aprendizado de um idioma, dê uma olhada nas listas de frases. Você pode construir as suas próprias listas ou ver as que outros usuários criaram. As listas podem ser baixadas e impressas.

Informações gerais sobre os arquivos

Os arquivos fornecidos aqui são atualizados todos os sábadps às 6:30 AM(UTC).

Muitas das frases em japonês e em inglês provém do Tanaka Corpus, que é de domínio público.

Creative Commons

Estes arquivos estão sobre a licença CC BY 2.0 FR.

Creative Commons License CC-BY

Uma parte de nossas sentenças está também disponível sobre a licença CC0 1.0.

Creative Commons License CC0

Licença que cobrem as gravações

A licença que cobre uma gravação é escolhida pelo contribuidor e é indicada na página que lista as gravações que ele ou ela contribuiu.

Dúvidas?

Caso você tenha dúvidas ou requisições, sinta-se à vontade para nos contactar. Normalmente respondemos rápido.

Downloads

Frases

Nome do arquivo

{{sentences | filename}}

Todos os idiomas
Apenas frases em: Abecásio Adigue Africâner Afrihili Aimará Aino Aklan Albanês Alemão Alemão (Suíça) Alemão da Pensilvânia Alemão de Palatinado Alemão Suábio Alto Sorábio Amárico Árabe Árabe (Argélia) Arábe (Egito) Árabe (Iraque) Árabe (Marrocos) Árabe do Golfo Árabe levantino do norte Aragonês Aramaico Antigo Aramaico Babilônico Judeu Aramaico Palestino Judeu Armênio Assamês Asturiano Awadhi Azerbaidjano Baixo Mari Baixo Sorábio Baixo-alemão (Baixo-saxão) Balinês Bambara Banjar Basco Bashkir Bávaro Baybaio Bengalês Berbere Bhojpuri Bicolano Central Bielorrusso Birmanês Bislamá Bodo Bokmål Norueguês Bósnio Bretão Brithenig Búlgaro Buriato Cabila Calmuco Cambojiano Canará Cantonês Carachaio-bálcara Carélio Cassúbio Catalão Caxemira Cayuga Cazaque Cebuano Chagatai Chamorro Chavacano Cherokee Chinês Gan Chinês Literário Chinês Pidgin Inglês Chinês Xiang Choctaw Chona Chukoto Cingalês Cinianja Concani (Goa) Coreano Córnico Corso Crioulo de Louisiana Crioulo de Maurício Crioulo de Seychelles Crioulo Haitiano Croata Curdo Cuyonon CycL Dacota Dinamarquês Divehi Dungano Dusun Central Dutton World Speedwords Emiliano Erromintxela Erzya Eslavo Oriental Antigo Eslovaco Esloveno Espanhol Espanhol Antigo Esperanto Estoniano Estremenho Evenki Ewe Fenício Feroico Fijano Finlandês Francês Francês antigo Francês creole de Guadalupe Francês Médio Frisão de Saterland Frisão do Norte Frísio Friulano Fula nigeriano Ga Gaélico Escocês Gagauz Galego Galês Garhwali Georgiano Gheg Albanês Grego Grego Antigo Groninguês Guarani Guerrero de Nahuatl Gujarati Hacá Haúça Havaiano Hebraico Hiligaino Hindi Hindi fijiano Hmong Daw Hmong Njua Ho Holandês Húngaro Iacuto Iban Ido Igbo Iídiche Ilocano Indonésio Inglês Inglês Antigo Inglês Médio Interlíngua Interlingue Inuíte Inuktitut Iorubá Irlandês Isan Islandês Italiano Izhoriano Jamaicano (patois jamaicano) Japonês Javanês Jin Juhuri Kadazan costeira Kamba Kapampangan Karakalpak Keningau Murut Khakas Khasi Kirundi Klingon Kölsch Komi-permyak Komi-Zyriano Kotava Kumyk Kven Filandês Laadanês Ladino Ladino Dolomítico Laosiano Latgália Latim Laz Letão Lígure Lingala Lingua Franca Nova Língua gótica Lituano Livônio Lojban Lombardo Luganda Luxemburguês Macedônio Madurês Maithili Malaiala Malaio Malaio Molucano Setentrional Malaio vernacular Malgaxe Maltês Mambae Manchu Mandarim (Chinês) Manês Maori Marata Mari Ocidental Marshalês Micmac Min do Sul Minangkabau Mingrélio Mirandês Mnong Central Mohawk Moksha Mon Mongol Naga (Tangshang) Nahuatl de Huasteca Central Nauatle Nauruano Navajo Neo-Aramaica Assíria Nepali Neuari Ngeq Niueano Nogai Nórdico Antigo Novial Novo Norueguês Nyungar Occitano Ojíbua Oquinauano Central Oriá Orizaba de Nahuatl Osseto Pachto Palauano Pangasinês Panjabi (Ocidental) Panjabi (Oriental) Papiamento Persa Picardo Piemontês Pipil Polonês Português Prussiano Antigo Pulaar Quenya Queqchi Quiché Quíchua Quiniaruanda Quirguiz Quiribati Rapanui Rifenho Riograndenser Hunsrückisch Romanche Romani Romeno Russo Rusyn Sami meridional Sami Setentrional Samoano Samogício Sango Sânscrito Sardo Saxão Antigo Scots Sérvio Sesoto meridional Shuswap Siciliano Sindarin Sindi Siríaco Somali Suaíli Suázi Sudanês Sueco Sumério Tachawit Tagal Murut Tagalo Tahaggart Tamahaq Tailandês Taitiano Tajique Talish Talossa Tâmil Tártaro Tártaro da Crimeia Tcheco Tchetcheno Tchuvache Telugo Temuano Tétum Tibetano Tigré Tigrínia Tok pisin Toki Pona Tonga Tonga (Zambezi) Toquelauano Tsonga Tswana Tupi antigo Turco Turco Antigo Turco Otomano Turcomeno Tuvaluano Tuviniano Uab Meto Ucraniano Udmurte Uigur Umbundu Uólofe Urdu Urhobo Usbeque Valão Veneziano Vepes Vietnamita Volapuque Võro Waray Xangainês Xhosa Zazaki Zulu Idioma desconhecido
Descrição do arquivo
Contêm todas as frases no idioma selecionado. Cada frase está associada a uma única ID e um código ISO 639-3.
Campos e estrutura
Número de identificação da frase [aba] Idioma [aba] Texto

Sentenças Detalhadas

Nome do arquivo

{{sentencesDetailed | filename}}

Todos os idiomas
Apenas frases em: Abecásio Adigue Africâner Afrihili Aimará Aino Aklan Albanês Alemão Alemão (Suíça) Alemão da Pensilvânia Alemão de Palatinado Alemão Suábio Alto Sorábio Amárico Árabe Árabe (Argélia) Arábe (Egito) Árabe (Iraque) Árabe (Marrocos) Árabe do Golfo Árabe levantino do norte Aragonês Aramaico Antigo Aramaico Babilônico Judeu Aramaico Palestino Judeu Armênio Assamês Asturiano Awadhi Azerbaidjano Baixo Mari Baixo Sorábio Baixo-alemão (Baixo-saxão) Balinês Bambara Banjar Basco Bashkir Bávaro Baybaio Bengalês Berbere Bhojpuri Bicolano Central Bielorrusso Birmanês Bislamá Bodo Bokmål Norueguês Bósnio Bretão Brithenig Búlgaro Buriato Cabila Calmuco Cambojiano Canará Cantonês Carachaio-bálcara Carélio Cassúbio Catalão Caxemira Cayuga Cazaque Cebuano Chagatai Chamorro Chavacano Cherokee Chinês Gan Chinês Literário Chinês Pidgin Inglês Chinês Xiang Choctaw Chona Chukoto Cingalês Cinianja Concani (Goa) Coreano Córnico Corso Crioulo de Louisiana Crioulo de Maurício Crioulo de Seychelles Crioulo Haitiano Croata Curdo Cuyonon CycL Dacota Dinamarquês Divehi Dungano Dusun Central Dutton World Speedwords Emiliano Erromintxela Erzya Eslavo Oriental Antigo Eslovaco Esloveno Espanhol Espanhol Antigo Esperanto Estoniano Estremenho Evenki Ewe Fenício Feroico Fijano Finlandês Francês Francês antigo Francês creole de Guadalupe Francês Médio Frisão de Saterland Frisão do Norte Frísio Friulano Fula nigeriano Ga Gaélico Escocês Gagauz Galego Galês Garhwali Georgiano Gheg Albanês Grego Grego Antigo Groninguês Guarani Guerrero de Nahuatl Gujarati Hacá Haúça Havaiano Hebraico Hiligaino Hindi Hindi fijiano Hmong Daw Hmong Njua Ho Holandês Húngaro Iacuto Iban Ido Igbo Iídiche Ilocano Indonésio Inglês Inglês Antigo Inglês Médio Interlíngua Interlingue Inuíte Inuktitut Iorubá Irlandês Isan Islandês Italiano Izhoriano Jamaicano (patois jamaicano) Japonês Javanês Jin Juhuri Kadazan costeira Kamba Kapampangan Karakalpak Keningau Murut Khakas Khasi Kirundi Klingon Kölsch Komi-permyak Komi-Zyriano Kotava Kumyk Kven Filandês Laadanês Ladino Ladino Dolomítico Laosiano Latgália Latim Laz Letão Lígure Lingala Lingua Franca Nova Língua gótica Lituano Livônio Lojban Lombardo Luganda Luxemburguês Macedônio Madurês Maithili Malaiala Malaio Malaio Molucano Setentrional Malaio vernacular Malgaxe Maltês Mambae Manchu Mandarim (Chinês) Manês Maori Marata Mari Ocidental Marshalês Micmac Min do Sul Minangkabau Mingrélio Mirandês Mnong Central Mohawk Moksha Mon Mongol Naga (Tangshang) Nahuatl de Huasteca Central Nauatle Nauruano Navajo Neo-Aramaica Assíria Nepali Neuari Ngeq Niueano Nogai Nórdico Antigo Novial Novo Norueguês Nyungar Occitano Ojíbua Oquinauano Central Oriá Orizaba de Nahuatl Osseto Pachto Palauano Pangasinês Panjabi (Ocidental) Panjabi (Oriental) Papiamento Persa Picardo Piemontês Pipil Polonês Português Prussiano Antigo Pulaar Quenya Queqchi Quiché Quíchua Quiniaruanda Quirguiz Quiribati Rapanui Rifenho Riograndenser Hunsrückisch Romanche Romani Romeno Russo Rusyn Sami meridional Sami Setentrional Samoano Samogício Sango Sânscrito Sardo Saxão Antigo Scots Sérvio Sesoto meridional Shuswap Siciliano Sindarin Sindi Siríaco Somali Suaíli Suázi Sudanês Sueco Sumério Tachawit Tagal Murut Tagalo Tahaggart Tamahaq Tailandês Taitiano Tajique Talish Talossa Tâmil Tártaro Tártaro da Crimeia Tcheco Tchetcheno Tchuvache Telugo Temuano Tétum Tibetano Tigré Tigrínia Tok pisin Toki Pona Tonga Tonga (Zambezi) Toquelauano Tsonga Tswana Tupi antigo Turco Turco Antigo Turco Otomano Turcomeno Tuvaluano Tuviniano Uab Meto Ucraniano Udmurte Uigur Umbundu Uólofe Urdu Urhobo Usbeque Valão Veneziano Vepes Vietnamita Volapuque Võro Waray Xangainês Xhosa Zazaki Zulu Idioma desconhecido
Descrição do arquivo
Contêm campos adicionais para cada frase (nome do proprietário, data criada/modificada).
Campos e estrutura
Número de identificação da frase [aba] Idioma [aba] Texto [aba] Nome de usuário [aba] Data de adição [aba] Data da última modificação

Sentenças (CC0)

Nome do arquivo

{{sentencesCC0 | filename}}

Todos os idiomas
Apenas frases em: Africâner Alemão Árabe Aramaico Antigo Berbere Bielorrusso Bokmål Norueguês Cabila Cantonês Carélio Catalão Chinês Literário Curdo Dinamarquês Espanhol Esperanto Fenício Finlandês Francês Hebraico Holandês Húngaro Iídiche Inglês Inglês Médio Interlíngua Islandês Italiano Izhoriano Japonês Klingon Kven Filandês Latim Lígure Lingua Franca Nova Mandarim (Chinês) Nyungar Polonês Português Quenya Romeno Russo Suaíli Sueco Tachawit Tcheco Turco Ucraniano Uigur Volapuque
Descrição do arquivo
Contêm todas as sentenças disponíveis sob a licença CC0.
Campos e estrutura
Número de identificação da frase [aba] Idioma [aba] Texto [aba] Data da última modificação

Ligações

Nome do arquivo
links.tar.bz2
Descrição do arquivo
Contém as ligações entre as frases. 1 [aba] 77 significa que a frase n.º 77 é uma tradução da frase n.º 1. Consta também a ligação recíproca; assim, o arquivo conterá também uma linha que diz 77 [aba] 1.
Campos e estrutura
Número de identificação da frase [aba] Número de identificação da tradução

Etiquetas

Nome do arquivo
tags.tar.bz2
Descrição do arquivo
Contém a lista de etiquetas associadas a cada frase. 381279 [aba] proverb significa que foi designada à frase n.º 381279 a etiqueta "provérbio".
Campos e estrutura
Número de identificação da frase [aba] Nome da etiqueta

Listas

Nome do arquivo
user_lists.tar.bz2
Descrição do arquivo
Contém a lista de listas de frases.
Campos e estrutura
Número de identificação da lista [aba] Nome de usuário [aba] Data de criação [aba] Data da última modificação [aba] Nome da lista [aba] Editável por

Frases em listas

Nome do arquivo
sentences_in_lists.tar.bz2
Descrição do arquivo
Indica as frases contidas em qualquer lista. 13 [aba] 381279 significa que a frase n.º 381279 está contida na lista cujo número de identificação é 13.
Campos e estrutura
Número de identificação da lista [aba] Número de identificação da frase

Índices do japonês

Nome do arquivo
jpn_indices.tar.bz2
Descrição do arquivo
Contém o equivalente ao "B Lines" do arquivo do Tanaka Corpus distribuído por Jim Breen. Veja esta página para o formato. Cada entrada está associada a um par de frases japonês/inglês. Número de identificação da frase se refere ao número de identificação da frase em japonês. Número de identificação do significado se refere ao número de identificação da frase em inglês.
Campos e estrutura
Número de identificação da frase [aba] Número de identificação do significado [aba] Texto

Frases com áudio

Nome do arquivo
sentences_with_audio.tar.bz2
Descrição do arquivo
Contêm as ids das sentenças, de todos os idiomas, para qual há gravações disponíveis. Outros campos indicam quem as gravou, a licença das mesmas e a URL que atribui o autor. Se o campo "licença" estiver vazia, você não deve reutilizar a gravação fora do Tatoeba.
Campos e estrutura
Número de identificação da frase [aba] Nome de usuário [aba] Licença [aba] URL de Atribuição

Nível do usuário por idioma

Nome do arquivo
user_languages.tar.bz2
Descrição do arquivo
Indica o nível dos membros relatado por eles mesmos em cada língua.
Campos e estrutura
Idioma [aba] Nível [aba] Nome de usuário [aba] Detalhes

Revisão de frases dos usuários

Nome do arquivo
users_sentences.csv
Descrição do arquivo
Contem sentenças revisadas por usuários. O valor da revisão pode ser -1 (sentença incorreta/"not OK"), 0 (indeciso ou inseguro) ou 1 (sentença correta). Aviso: Essas dados são ainda experimentais.
Campos e estrutura
Nome de usuário [aba] Idioma [aba] Número de identificação da frase [aba] Revisão [aba] Data de adição [aba] Data da última modificação

Transcrições

Nome do arquivo

{{transcriptions | filename}}

Todos os idiomas
Apenas frases em: Cantonês Japonês Mandarim (Chinês) Usbeque
Descrição do arquivo
Contêm todas as transcrições em scripts auxiliares ou alternativos. Um nome de usuário associado a uma transcrição indica o usuário que a revisou pela última vez e possivelmente a modificou. Uma transcrição sem nome de usuário não foi marcada como revisada. O nome do script é definido de acordo com o padrão ISO 15924.
Campos e estrutura
Número de identificação da frase [aba] Idioma [aba] Nome do script [aba] Nome de usuário [aba] Transcrição