Nota
Los datos que encontrará aquí NO le serán de utilidad a menos que esté implementando una herramienta de procesamiento del lenguaje o de procesamiento de datos.
Si solo quiere utilizar frases para aprender un idioma, busque en las listas de frases. Puede crear las suyas propias o ver las que otros han creado. Las listas pueden ser descargadas o imprimidas.
Información general acerca de los ficheros
Muchas de las oraciones en japones y en inglés provienen del Corpus Tanaka que forma parte del dominio público.
Creative commons
Estos archivos se suministran bajo licencia CC BY 2.0 FR.
Una parte de nuestras oraciones también están disponibles bajo licencia CC0 1.0.
Licencias que cubren la voz
La licencia que cubre una voz es elegida por el colaborador, y se indica en la página que enumera las voces que él o ella ha grabado.
¿Preguntas?
Si tienes preguntas o peticiones, contáctanos para en cualquier momento. Normalmente contestamos enseguida.
Descargas
Utilize esta herramienta para generar y descargar exportaciones personalizadas a pedido.
Descargar todas las oraciones en idioma A que tienen traducciones al idioma B, junto con las traducciones.
Oraciones
- Nombre de archivo
-
Todos los idiomas Sólo frases en: Abjasio Adigués Afrihili Afrikáans Aimara Ainu Aklanón Albanés Albanés Gheg Alemán Alemán Bajo (Sajón Bajo) Alemán de Pensilvania Alemán Palatino Alemán Suizo Altaico del Sur Alto Sorabo Amárico Antiguo Eslavo Oriental Árabe Árabe de Argelia Árabe del Golfo Árabe Egipcio Árabe Iraquí Árabe Levantino Árabe Levantino del Sur Árabe Libio Árabe Marroquí Aragonés Arameo Antiguo Arameo Judeobabilónico Arameo Judeopalestino Asamés Asturiano (bable) Avar Awadhi Azerbaiyano Bajo Sorabo Bali Balochi Bambara Banjar Baskiro Bávaro Baybayanon Bengalí Berom Bhojpuri Bicolano Bielorruso Birmano Bislama Bodo Bosnio Bretón Brithenig Búlgaro Buriato Cabilo Cachemiro Calmuco Camboyano Canarés Carelio Castellano Antiguo Casubio Catalán Cayuga Cebuano Chabacano Chagatái Chamorro Checheno Checo Cheroqui Chino Cantonés Chino Gan Chino Hakka Chino Jin Chino Literario Chino Mandarín Chino Min Nan Chino Shanghainés Chino Xiang Choctaw Chukchi Chuvasio Cingalés Coreano Córnico Corso Cree de las llanuras Criollo de Luisiana Criollo de Seychelles Criollo Guadalupano Criollo Haitiano Criollo Jamaiquino Criollo Mauriciano Croata Cumuco Cusita Cuyonon CycL Danés Dhivehi Drents Dungan Dusún Central Dutton World Speedwords Eastern Armenian Emiliano Erromintxela Erzya Escocés Eslovaco Esloveno Español Esperanto Estonio Euskera Evenki Ewé Extremeño Fenicio Feroés Finlandés Finlandés Kven Fiyiano Francés Francés antiguo Francés Medieval Frisón Frisón Antiguo Frisón del norte Frisón Oriental Friuliano Fula Nigeriano Ga Gaélico Escocés Gagauzo Galés Gallego Garhwali Georgiano Gótico Griego Griego Antiguo Groenlandés Groningués Guaraní Gujarati Haida Norteño Haida Sureño Hausa Hawaiano Hebreo Hebreo Antiguo Hiligaynon Hindi Hindi Fiyiano Hitchiti Hmong (Blanco) Hmong (Verde) Ho Húngaro Hunsrik Iban Idioma Nuosu Idioma sylheti Ido Igbo Ilocano Indonesio Inglés Inglés Antiguo Inglés Medieval Inglés Pidgin Chino Ingrio Interglosa Interlingua Interlingue Inuktitut Irlandés Isan Islandés Italiano Jakasio Japonés Javanés Jerga Chinuk Judeo-español Juhuri (Judeo-Tat) Kabardiano Kadazán Costero Kanuri Central Karachay Balkar Karakalpako Karakhanid Kashgai Kazajo Kekchí (Q'eqchi') Keningau Murut Khalaj Khasi Kikamba Kiniaruanda Kirguís Kiribatiano Kirundi Klingon Kölsch Komi-Permiako Komi-Ziriano Konkani (Goan) Kotava Kurdo Central (Sorani) Kurdo Norteño (Kurmanji) Kurdo Sureño Láadan Ladino Lakota Laosiano Latgaliano Latín Laz Letón Ligurio Limburgués Lingala Lingua Franca Nova Lituano Livonio Lojban Lombardo Luganda Lushootseed Luxemburgués Macedonio Madurés Mahasu Pahari Maitilí Malayalam Malayo Malayo (Vernacular) Malayo de Moluca Malayo Kelantan-Pattani Malgache Maltés Mambái Manchú Manés Maorí mapuche Maratí Mari Mari de las Colinas Marshalés Maya Megreliano Meitei Mi'kmaq Minangkabau Mirandés Mnong Central Mohawk Moksha Mon Mongol Mono (EE. UU.) Muskogee (Creek) Naga (Tangshang) Náhuatl Náhuatl de Guerrero Náhuatl de la Huasteca Náhuatl de Orizaba Nande Napolitano Nauruano Navajo Neerlandés Neoarameo asirio Nepalí Newari Ngeq Niueano Nogayo Nórdico Antiguo Noruego Bokmål Noruego Nynorsk Novial Nuer Nungar Ñanya O'odham Occitano Okinawense Oriyá (Odia) Osético Oyibua Palauano Pali Pampango Pangasinán Panyabí (Gurmukhi) Panyabí (Shahmukhi) Papiamento Pastún Persa Persa Medieval (Pahlavi) Piamontés Picardo Pipil Polaco Portugués Prusiano Antiguo Pular Quechua Quenya Quiché Rapa Nui Rifeño Rohinyá Romanche Romaní Rumano Rusino Ruso Sajón Antiguo Sami Meridional Sami Septentrional Samoano Samogitano Sango Sánscrito Santali Saraiki Sardo Serbio Sesotho del Sur Setsuana Shona Shuswap Siciliano Silesio Sindarin Sindhi Siríaco Somalí Sranan Tongo Suabo Suajili Suajili del Congo Suati Subanen del Sur Sueco Sumerio Sundanés Tacawit Tagal Murut Tagalo Tahitiano Tailandés Talesí Talosano Tamasheq Tahaggart Tamazí Tamazight estándar marroquí Tamil Tártaro Tártaro de Crimea Tashelhit Tayiko Telugu Temuano Tetun Tibetano Tigre Tigriña Tok Pisin Tokelauano Toki Pona Tonga (Zambezi) Tongano Tsonga tumbuka Tupí Antiguo Turco Turco Antiguo Turco Otomano Turcomano Tuvaluano Tuviniano Uab Meto Ucraniano Udmurto Uigur Umbundú Uolof Urdu Urhobo Uzbeko Valón Veneciano Vepsio Vietnamita Volapük Võro Waray Wayú Xhosa Yakuto Yidis Yoruba Zazaki Zazaki Norteño (Kirmanjki) Zazaki Sureño (Dimli) Zelandés Zulú Idioma desconocido - Descripción del archivo
- Contiene todas las frases en el idioma seleccionado. Cada oración está asociada a una identidad única y a un código lingüístico ISO 639-3 .
- Campos y estructura
- Id de la oración [tabulador] Idioma [tabulador] Texto
Oraciones detalladas
- Nombre de archivo
-
{{sentencesDetailed | filename}}
Todos los idiomas Sólo frases en: Abjasio Adigués Afrihili Afrikáans Aimara Ainu Aklanón Albanés Albanés Gheg Alemán Alemán Bajo (Sajón Bajo) Alemán de Pensilvania Alemán Palatino Alemán Suizo Altaico del Sur Alto Sorabo Amárico Antiguo Eslavo Oriental Árabe Árabe de Argelia Árabe del Golfo Árabe Egipcio Árabe Iraquí Árabe Levantino Árabe Levantino del Sur Árabe Libio Árabe Marroquí Aragonés Arameo Antiguo Arameo Judeobabilónico Arameo Judeopalestino Asamés Asturiano (bable) Avar Awadhi Azerbaiyano Bajo Sorabo Bali Balochi Bambara Banjar Baskiro Bávaro Baybayanon Bengalí Berom Bhojpuri Bicolano Bielorruso Birmano Bislama Bodo Bosnio Bretón Brithenig Búlgaro Buriato Cabilo Cachemiro Calmuco Camboyano Canarés Carelio Castellano Antiguo Casubio Catalán Cayuga Cebuano Chabacano Chagatái Chamorro Checheno Checo Cheroqui Chino Cantonés Chino Gan Chino Hakka Chino Jin Chino Literario Chino Mandarín Chino Min Nan Chino Shanghainés Chino Xiang Choctaw Chukchi Chuvasio Cingalés Coreano Córnico Corso Cree de las llanuras Criollo de Luisiana Criollo de Seychelles Criollo Guadalupano Criollo Haitiano Criollo Jamaiquino Criollo Mauriciano Croata Cumuco Cusita Cuyonon CycL Danés Dhivehi Drents Dungan Dusún Central Dutton World Speedwords Eastern Armenian Emiliano Erromintxela Erzya Escocés Eslovaco Esloveno Español Esperanto Estonio Euskera Evenki Ewé Extremeño Fenicio Feroés Finlandés Finlandés Kven Fiyiano Francés Francés antiguo Francés Medieval Frisón Frisón Antiguo Frisón del norte Frisón Oriental Friuliano Fula Nigeriano Ga Gaélico Escocés Gagauzo Galés Gallego Garhwali Georgiano Gótico Griego Griego Antiguo Groenlandés Groningués Guaraní Gujarati Haida Norteño Haida Sureño Hausa Hawaiano Hebreo Hebreo Antiguo Hiligaynon Hindi Hindi Fiyiano Hitchiti Hmong (Blanco) Hmong (Verde) Ho Húngaro Hunsrik Iban Idioma Nuosu Idioma sylheti Ido Igbo Ilocano Indonesio Inglés Inglés Antiguo Inglés Medieval Inglés Pidgin Chino Ingrio Interglosa Interlingua Interlingue Inuktitut Irlandés Isan Islandés Italiano Jakasio Japonés Javanés Jerga Chinuk Judeo-español Juhuri (Judeo-Tat) Kabardiano Kadazán Costero Kanuri Central Karachay Balkar Karakalpako Karakhanid Kashgai Kazajo Kekchí (Q'eqchi') Keningau Murut Khalaj Khasi Kikamba Kiniaruanda Kirguís Kiribatiano Kirundi Klingon Kölsch Komi-Permiako Komi-Ziriano Konkani (Goan) Kotava Kurdo Central (Sorani) Kurdo Norteño (Kurmanji) Kurdo Sureño Láadan Ladino Lakota Laosiano Latgaliano Latín Laz Letón Ligurio Limburgués Lingala Lingua Franca Nova Lituano Livonio Lojban Lombardo Luganda Lushootseed Luxemburgués Macedonio Madurés Mahasu Pahari Maitilí Malayalam Malayo Malayo (Vernacular) Malayo de Moluca Malayo Kelantan-Pattani Malgache Maltés Mambái Manchú Manés Maorí mapuche Maratí Mari Mari de las Colinas Marshalés Maya Megreliano Meitei Mi'kmaq Minangkabau Mirandés Mnong Central Mohawk Moksha Mon Mongol Mono (EE. UU.) Muskogee (Creek) Naga (Tangshang) Náhuatl Náhuatl de Guerrero Náhuatl de la Huasteca Náhuatl de Orizaba Nande Napolitano Nauruano Navajo Neerlandés Neoarameo asirio Nepalí Newari Ngeq Niueano Nogayo Nórdico Antiguo Noruego Bokmål Noruego Nynorsk Novial Nuer Nungar Ñanya O'odham Occitano Okinawense Oriyá (Odia) Osético Oyibua Palauano Pali Pampango Pangasinán Panyabí (Gurmukhi) Panyabí (Shahmukhi) Papiamento Pastún Persa Persa Medieval (Pahlavi) Piamontés Picardo Pipil Polaco Portugués Prusiano Antiguo Pular Quechua Quenya Quiché Rapa Nui Rifeño Rohinyá Romanche Romaní Rumano Rusino Ruso Sajón Antiguo Sami Meridional Sami Septentrional Samoano Samogitano Sango Sánscrito Santali Saraiki Sardo Serbio Sesotho del Sur Setsuana Shona Shuswap Siciliano Silesio Sindarin Sindhi Siríaco Somalí Sranan Tongo Suabo Suajili Suajili del Congo Suati Subanen del Sur Sueco Sumerio Sundanés Tacawit Tagal Murut Tagalo Tahitiano Tailandés Talesí Talosano Tamasheq Tahaggart Tamazí Tamazight estándar marroquí Tamil Tártaro Tártaro de Crimea Tashelhit Tayiko Telugu Temuano Tetun Tibetano Tigre Tigriña Tok Pisin Tokelauano Toki Pona Tonga (Zambezi) Tongano Tsonga tumbuka Tupí Antiguo Turco Turco Antiguo Turco Otomano Turcomano Tuvaluano Tuviniano Uab Meto Ucraniano Udmurto Uigur Umbundú Uolof Urdu Urhobo Uzbeko Valón Veneciano Vepsio Vietnamita Volapük Võro Waray Wayú Xhosa Yakuto Yidis Yoruba Zazaki Zazaki Norteño (Kirmanjki) Zazaki Sureño (Dimli) Zelandés Zulú Idioma desconocido - Descripción del archivo
- Incluye campos adicionales para cada frase (nombre del propietario, fecha de creación/modificación).
- Campos y estructura
- Id de la oración [tabulador] Idioma [tabulador] Texto [tabulador] Usuario [tabulador] Fecha de adición [tabulador] Fecha de última modificación
Oraciones originales y traducidas
- Nombre de archivo
- sentences_base.tar.bz2
- Descripción del archivo
-
Cada oración se enlista como original o traducción de otra. El campo "base" puede tener los siguientes valores:
- zero: La oración es una original, no una traducción de otra oración.
- mayor que cero: La id de la oración de la que se tradujo.
- \N: Desconocido (raro).
- Campos y estructura
- Id de la oración [tabulador] Campo base
Oraciones (CC0)
- Nombre de archivo
-
Todos los idiomas Sólo frases en: Alemán Árabe Árabe de Argelia Arameo Antiguo Arameo Judeobabilónico Arameo Judeopalestino Bengalí Bielorruso Cabilo Carelio Catalán Checo Chino Cantonés Chino Literario Chino Mandarín Danés Español Esperanto Fenicio Finlandés Finlandés Kven Francés Frisón Antiguo Galés Griego Antiguo Hebreo Hebreo Antiguo Hindi Ho Húngaro Idioma sylheti Ido Inglés Inglés Medieval Interlingua Italiano Japonés Judeo-español Klingon Láadan Latín Ligurio Neerlandés Nórdico Antiguo Noruego Bokmål Nungar Polaco Portugués Ruso Santali Sueco Tacawit Tamazí Tamazight estándar marroquí Toki Pona Ucraniano Volapük Yidis Idioma desconocido - Descripción del archivo
- Contiene todas las oraciones disponibles bajo CC0.
- Campos y estructura
- Id de la oración [tabulador] Idioma [tabulador] Texto [tabulador] Fecha de última modificación
Enlaces
- Nombre de archivo
- links.tar.bz2
- Descripción del archivo
- Contiene enlaces entre las oraciones. 1 [tabulador] 77 significa que la oración nº 77 es la traducción de la oración nº 1. El enlace recíproco también está presente, por lo que el fichero también contendrá una línea que diga 77 [tabulador] 1.
- Campos y estructura
- Id de la oración [tabulador] Id de la traducción
Etiquetas
- Nombre de archivo
- tags.tar.bz2
- Descripción del archivo
- Contiene una lista de etiquetas asociadas con cada oración. 381279 [tabulador] proverb significa que la oración nº 381279 fue asociada a la etiqueta "proverb".
- Campos y estructura
- Id de la oración [tabulador] Nombre de etiqueta
Listas
- Nombre de archivo
- user_lists.tar.bz2
- Descripción del archivo
- Contiene la lista de listas de oraciones.
- Campos y estructura
- Id de la lista [tabulador] Usuario [tabulador] Fecha de creación [tabulador] Fecha de última modificación [tabulador] Nombre de lista [tabulador] Editable por
Oraciones en listas
- Nombre de archivo
- sentences_in_lists.tar.bz2
- Descripción del archivo
- Indica las oraciones que están contenidas en alguna lista. 13 [tabulador] 381279 significa que la oración nº 381279 está contenida en la lista que tiene el id 13.
- Campos y estructura
- Id de la lista [tabulador] Id de la oración
Índices japoneses
- Nombre de archivo
- jpn_indices.tar.bz2
- Descripción del archivo
- Contiene el equivalente a las "líneas B" en el fichero del Corpus Tanaka distribuido por Jim Breen. Lea esta página para más información sobre el formato. Cada entrada está asociada a un par de oraciones en japones/inglés. Id de la oración hace referencia al id de la oración en japones. Id del significado hace referencia al id de la oración en inglés.
- Campos y estructura
- Id de la oración [tabulador] Id del significado [tabulador] Texto
Oraciones con voz
- Nombre de archivo
- sentences_with_audio.tar.bz2
- Descripción del archivo
- Contiene la identidad de las oraciones, en todos los idiomas, para las cuales hay voz disponible. Otros datos indican quién grabó la voz, su licencia y una URL para atribuir el autor. Si el espacio de licencia está vacío, no podrá reutilizar la voz fuera del proyecto Tatoeba.
- Downloading audio
- A single sentence can have one or more audio, each from a different voice. To download a particular audio, use its audio id to compute the download URL. For example, to download the audio with the id 1234, the URL is https://tatoeba.org/audio/download/1234.
- Campos y estructura
- Id de la oración [tabulador] Audio id [tabulador] Usuario [tabulador] Licencia [tabulador] Atribución de URL
Nivel de competencia del usuario por idioma
- Nombre de archivo
- user_languages.tar.bz2
- Descripción del archivo
- Indica los niveles de competencia que declaran tener los miembros en un idioma determinado.
- Campos y estructura
- Idioma [tabulador] Nivel de competencia [tabulador] Usuario [tabulador] Detalles
Revisiones de frases del usuario
- Nombre de archivo
- users_sentences.csv
- Descripción del archivo
- Contiene frases revisadas por usuarios. El valor de la revisión puede ser -1 (frase no correcta), 0 (indeciso o inseguro), o 1 (frase correcta). Advertencia: esta información está en fase experimental.
- Campos y estructura
- Usuario [tabulador] Id de la oración [tabulador] Revisión [tabulador] Fecha de adición [tabulador] Fecha de última modificación
Transcripciones
- Nombre de archivo
-
Todos los idiomas Sólo frases en: Chino Cantonés Chino Mandarín Japonés Uzbeko - Descripción del archivo
- Contiene todas las transcripciones en documentos auxiliares o alternativos. Un nombre de usuario asociado con una transcripción señala al usuario que lo revisó y, posiblemente, lo revisó la última vez. Una transcripción sin nombre de usuario no se marca como revisada. El nombre del documento se define según la norma ISO 15924.
- Campos y estructura
- Id de la oración [tabulador] Idioma [tabulador] Nombre del documento [tabulador] Usuario [tabulador] Transcripción