clear
swap_horiz
search

Nota

Se você só estiver interessado em frases que podem lhe ser úteis no aprendizado de um idioma, dê uma olhada nas listas de frases. Você pode construir as suas próprias listas ou ver as que outros usuários criaram. As listas podem ser baixadas e impressas.

Informações gerais sobre os arquivos

Muitas das frases em japonês e em inglês provém do Tanaka Corpus, que é de domínio público.

Creative Commons

Estes arquivos são distribuídos sob a CC-BY.

Creative Commons License

Licença que cobrem as gravações

A licença que cobre uma gravação é escolhida pelo contribuidor e é indicada na página que lista as gravações que ele ou ela contribuiu.

Dúvidas?

Se você tiver alguma dúvida ou pedido, fique à vontade para entrar em contato conosco. Costumamos responder com bastante rapidez.

Downloads

Frases

Baixar
1. http://downloads.tatoeba.org/exports/sentences.tar.bz2
2. http://downloads.tatoeba.org/exports/sentences_detailed.tar.bz2
Campos e estrutura
1. Número de identificação da frase [aba] Idioma [aba] Texto
2. Número de identificação da frase [aba] Idioma [aba] Texto [aba] Nome de usuário [aba] Data de adição [aba] Data da última modificação
Descrição do arquivo
Contém todas as frases. Cada frase está associada a um único número de identificação e a um código ISO 639-3.

Ligações

Baixar
http://downloads.tatoeba.org/exports/links.tar.bz2
Campos e estrutura
Número de identificação da frase [aba] Número de identificação da tradução
Descrição do arquivo
Contém as ligações entre as frases. 1 [aba] 77 significa que a frase n.º 77 é uma tradução da frase n.º 1. Consta também a ligação recíproca; assim, o arquivo conterá também uma linha que diz 77 [aba] 1 .

Etiquetas

Baixar
http://downloads.tatoeba.org/exports/tags.tar.bz2
Campos e estrutura
Número de identificação da frase [aba] Nome da etiqueta
Descrição do arquivo
Contém a lista de etiquetas associadas a cada frase. 381279 [aba] proverb significa que foi designada à frase n.º 381279 a etiqueta "provérbio".

Listas

Baixar
http://downloads.tatoeba.org/exports/user_lists.tar.bz2
Campos e estrutura
Número de identificação da lista [aba] Nome de usuário [aba] Data de criação [aba] Data da última modificação [aba] Nome da lista [aba] Editável por
Descrição do arquivo
Contém a lista de listas de frases.

Frases em listas

Baixar
http://downloads.tatoeba.org/exports/sentences_in_lists.tar.bz2
Campos e estrutura
Número de identificação da lista [aba] Número de identificação da frase
Descrição do arquivo
Indica as frases contidas em qualquer lista. 13 [aba] 381279 significa que a frase n.º 381279 está contida na lista cujo número de identificação é 13.

Índices do japonês

Baixar
http://downloads.tatoeba.org/exports/jpn_indices.tar.bz2
Campos e estrutura
Número de identificação da frase [aba] Número de identificação do significado [aba] Texto
Descrição do arquivo
Contém o equivalente ao "B Lines" do arquivo do Tanaka Corpus distribuído por Jim Breen. Veja esta página para o formato. Cada entrada está associada a um par de frases japonês/inglês. Número de identificação da frase se refere ao número de identificação da frase em japonês. Número de identificação do significado se refere ao número de identificação da frase em inglês.

Frases com áudio

Baixar
http://downloads.tatoeba.org/exports/sentences_with_audio.tar.bz2
Campos e estrutura
Número de identificação da frase [aba] Nome de usuário [aba] Licença [aba] URL de Atribuição
Descrição do arquivo
Contêm as ids das sentenças, de todos os idiomas, para qual há gravações disponíveis. Outros campos indicam quem as gravou, a licença das mesmas e a URL que atribui o autor. Se o campo "licença" estiver vazia, você não deve reutilizar a gravação fora do Tatoeba.

Nível do usuário por idioma

Baixar
http://downloads.tatoeba.org/exports/user_languages.tar.bz2
Campos e estrutura
Idioma [aba] Nível [aba] Nome de usuário [aba] Detalhes
Descrição do arquivo
Indica o nível dos membros relatado por eles mesmos em cada língua.

Classificações das frases dos usuários

Baixar
http://downloads.tatoeba.org/exports/users_sentences.csv
Campos e estrutura
Nome de usuário [aba] Idioma [aba] Número de identificação da frase [aba] Classificação [aba] Data de adição [aba] Data da última modificação
Descrição do arquivo
Contém frases classificadas pelos usuários. O valor da classificação pode ser -1 (a frase não é aprovada pelo usuário), 0 (o usuário não tem certeza sobre a classificação) ou 1 (a frase é aprovada pelo usuário).