Nota
I dati che troverai qui NON saranno utili finché non starai creando uno strumento per le lingue o analizzando dei dati.
Se più semplicemente vuoi delle frasi da poter utilizzare per imparare una lingua, dai un'occhiata agli elenchi di frasi. Puoi crearne uno tuo, oppure puoi visualizzre quelli creati dagli altri. Gli elenchi possono essere scaricati e stampati.
Informazioni generali sui file
Molte delle frasi in giapponese e in inglese provengono dal Tanaka Corpus, che è di pubblico dominio.
Creative commons
Questi file sono rilasciati sotto la licenza CC BY 2.0 FR.

Una parte delle nostre frasi è disponibile anche sotto la licenza CC0 1.0.

Licenze relative ai file audio
La licenza che ricopre un file audio è scelta dal contributore, ed è indicata nella pagina che elenca i file audio che lui o lei ha contribuito.
Domande?
Se hai delle domande o delle richieste, sentiti libero o libera di contattarci. In generale, rispondiamo rapidamente.
Download
Utilizza questo strumento per generare e scaricare delle esportazioni personalizzate in maniera on demand.
Scarica tutte le frasi nella lingua A che sono tradotte nella lingua B, assieme alle traduzioni.
Frasi
- Nome del file
-
tutte le lingue Solo le frasi in abazino abcaso adighè afrihili afrikaans ainu aklan albanese albanese ghego altai meridionale amarico antico slavo orientale arabo arabo algerino arabo del golfo arabo egiziano arabo iracheno arabo levantino arabo levantino meridionale arabo libico arabo marocchino aragonese aramaico antico aramaico giudaico babilonese aramaico giudaico palestinese armeno orientale assamese asturiano avaro awadhi aymara azero balinese bambara banjar baschiro basco basso-tedesco (basso sassone) bavarese baybayanon beluci bengalese berbero berbero marocchino standard berom bhojpuri bicolano centrale bielorusso birmano bislama bodo bosniaco bretone brithenig bulgaro buriato cabardo cabilo calmucco cantonese caraciai-balcaro careliano casciubo catalano cayuga cebuano ceceno ceco chagatai chakasso chamorro chavacano di Zamboanga cherokee chewa choctaw cinese Gan cinese Jin cinese letterario cinese mandarino cinese Min Nan cinese Xiang ciukcio ciuvascio coreano cornico còrso cree di pianura creolo della Louisiana creolo delle Antille creolo delle Seychelles creolo giamaicano creolo haitiano creolo mauriziano croato cumucco curdo centrale (Sorani) curdo meridionale curdo settentrionale (Kurmaci) cuyonon CycL danese Dhivehi dialetto armeno occidentale Drèents dungano dusun centrale Dutton World Speedwords ebraico ebraico antico emiliano erromintxela erza esperanto estone estremegno evenki ewe faroese fenicio figiano finlandese francese francese antico francese medio frisone frisone antico frisone orientale frisone settentrionale friulano fula ga gaelico scozzese gagauzo gallego gallese garhwal georgiano gergo chinook giapponese giavanese gilbertese gotico greco greco antico groenlandese Gronings guaraní gujarati gungbe haida meridionale haida settentrionale hakka hausa hawaiano hiligaynon hindi hindi figiano hitchiti Hmong Daw (bianco) Hmong Njua (verde) ho hunsrik iban ido igbo ilocano indonesiano inglese inglese antico inglese medio inglese pidgin cinese ingrico interglossa interlingua interlingue interslavo inuktitut irlandese isan islandese italiano juhuri (giudeo-Tat) k'iche' kadazan litoraneo kamba kannada kanuri centrale kapampangan karakalpako karakhanide kashmiri kazaco kekchi (q'eqchi') keningau murut khalaj khasi khmer kinyarwanda kirghiso kirundi klingon kölsch konkani (goano) kotava kven láadan ladino (America Centrale) ladino (Italia) lakota lao latino laz lesgo letgallo lettone ligure limburghese lingala lingua di Okinawa Lingua Franca Nova lingua saraiki lingua silotica lituano livone lojban lombardo luganda lushootseed lussemburghese macedone madurese Mahasu Pahari maithili malayalam malese malese (dialettale) malese di Ternate malgascio maltese mambae mancese manipuri mannese maori mapudungun marathi mari occidentale mari orientale marshallese maya yucateco medio persiano (pahlavi) mengrelio micmac minangkabau mirandese Mnong del centro mohawk mokša mon mongolo mono (Stati Uniti d'America) muscogee (creek) naga (Tangshang) nāhuatl nāhuatl di Guerrero nāhuatl di Orizaba nāhuatl huaxteca centrale nande napoletano nauruano navajo neo-aramaico assiro Nepal Bhasa nepalese ngeq niueano nogai noongar norreno norvegese bokmål norvegese nynorsk novial nuer nuosu o'odham occitano odia (oriya) ojibwe olandese oromonico centro-occidentale osseto palauano pāli pangasinan papiamento pashtu permiaco persiano piccardo piemontese pipil polacco portoghese prussiano arcaico pulaar punjabi (occidentale) punjabi (orientale) qashqai quechua quenya rapanui rendille rohingya romancio romani rumeno russo ruteno sacha sami meridionale sami settentrionale samoano samogitico sango sanscrito santali sardo sassone antico scots serbo shanghainese shona shuswap siciliano sindarin sindhi singalese siriaco sirieno slesiano slovacco sloveno somalo sorabo inferiore sorabo superiore sotho meridionale spagnolo spagnolo antico sranan tongo subanon meridionale sumero sundanese svedese svevo swahili swahili del Congo swati tagal murut tagalog tagico tahitiano taliscio talossano tamil tarifit tashawit tashelhit tatarico tataro di Crimea tedesco tedesco della Pennsylvania tedesco palatino tedesco svizzero telugu temuan tetum thailandese tibetano tigrè tigrino tok pisin tokelauana toki pona tongano tongano (Zambezi) tsonga tswana tuareg tumbuka tupi antico turco turco antico turco ottomano turkmeno tuvaluano tuvano Uab Meto ucraino udmurto uiguro umbundu ungherese urdu urhobo uzbeko vallone veneto vepso vietnamita volapük võro waráy wayuu wolof xhosa yawi yiddish yoruba zazaki zazaki meridionale (Dimli) zazaki settentrionale (Kirmanjki) zelandese zulu Lingua sconosciuta - Descrizione del file
- Contiene tutte le frasi nella lingua selezionata. Ogni frase è associata ad un ID univoco e un codice della lingua ISO 639-3.
- Campi e struttura
- ID della frase [tab] Lingua [tab] Testo
Frasi con i dettagli
- Nome del file
-
{{sentencesDetailed | filename}}
tutte le lingue Solo le frasi in abazino abcaso adighè afrihili afrikaans ainu aklan albanese albanese ghego altai meridionale amarico antico slavo orientale arabo arabo algerino arabo del golfo arabo egiziano arabo iracheno arabo levantino arabo levantino meridionale arabo libico arabo marocchino aragonese aramaico antico aramaico giudaico babilonese aramaico giudaico palestinese armeno orientale assamese asturiano avaro awadhi aymara azero balinese bambara banjar baschiro basco basso-tedesco (basso sassone) bavarese baybayanon beluci bengalese berbero berbero marocchino standard berom bhojpuri bicolano centrale bielorusso birmano bislama bodo bosniaco bretone brithenig bulgaro buriato cabardo cabilo calmucco cantonese caraciai-balcaro careliano casciubo catalano cayuga cebuano ceceno ceco chagatai chakasso chamorro chavacano di Zamboanga cherokee chewa choctaw cinese Gan cinese Jin cinese letterario cinese mandarino cinese Min Nan cinese Xiang ciukcio ciuvascio coreano cornico còrso cree di pianura creolo della Louisiana creolo delle Antille creolo delle Seychelles creolo giamaicano creolo haitiano creolo mauriziano croato cumucco curdo centrale (Sorani) curdo meridionale curdo settentrionale (Kurmaci) cuyonon CycL danese Dhivehi dialetto armeno occidentale Drèents dungano dusun centrale Dutton World Speedwords ebraico ebraico antico emiliano erromintxela erza esperanto estone estremegno evenki ewe faroese fenicio figiano finlandese francese francese antico francese medio frisone frisone antico frisone orientale frisone settentrionale friulano fula ga gaelico scozzese gagauzo gallego gallese garhwal georgiano gergo chinook giapponese giavanese gilbertese gotico greco greco antico groenlandese Gronings guaraní gujarati gungbe haida meridionale haida settentrionale hakka hausa hawaiano hiligaynon hindi hindi figiano hitchiti Hmong Daw (bianco) Hmong Njua (verde) ho hunsrik iban ido igbo ilocano indonesiano inglese inglese antico inglese medio inglese pidgin cinese ingrico interglossa interlingua interlingue interslavo inuktitut irlandese isan islandese italiano juhuri (giudeo-Tat) k'iche' kadazan litoraneo kamba kannada kanuri centrale kapampangan karakalpako karakhanide kashmiri kazaco kekchi (q'eqchi') keningau murut khalaj khasi khmer kinyarwanda kirghiso kirundi klingon kölsch konkani (goano) kotava kven láadan ladino (America Centrale) ladino (Italia) lakota lao latino laz lesgo letgallo lettone ligure limburghese lingala lingua di Okinawa Lingua Franca Nova lingua saraiki lingua silotica lituano livone lojban lombardo luganda lushootseed lussemburghese macedone madurese Mahasu Pahari maithili malayalam malese malese (dialettale) malese di Ternate malgascio maltese mambae mancese manipuri mannese maori mapudungun marathi mari occidentale mari orientale marshallese maya yucateco medio persiano (pahlavi) mengrelio micmac minangkabau mirandese Mnong del centro mohawk mokša mon mongolo mono (Stati Uniti d'America) muscogee (creek) naga (Tangshang) nāhuatl nāhuatl di Guerrero nāhuatl di Orizaba nāhuatl huaxteca centrale nande napoletano nauruano navajo neo-aramaico assiro Nepal Bhasa nepalese ngeq niueano nogai noongar norreno norvegese bokmål norvegese nynorsk novial nuer nuosu o'odham occitano odia (oriya) ojibwe olandese oromonico centro-occidentale osseto palauano pāli pangasinan papiamento pashtu permiaco persiano piccardo piemontese pipil polacco portoghese prussiano arcaico pulaar punjabi (occidentale) punjabi (orientale) qashqai quechua quenya rapanui rendille rohingya romancio romani rumeno russo ruteno sacha sami meridionale sami settentrionale samoano samogitico sango sanscrito santali sardo sassone antico scots serbo shanghainese shona shuswap siciliano sindarin sindhi singalese siriaco sirieno slesiano slovacco sloveno somalo sorabo inferiore sorabo superiore sotho meridionale spagnolo spagnolo antico sranan tongo subanon meridionale sumero sundanese svedese svevo swahili swahili del Congo swati tagal murut tagalog tagico tahitiano taliscio talossano tamil tarifit tashawit tashelhit tatarico tataro di Crimea tedesco tedesco della Pennsylvania tedesco palatino tedesco svizzero telugu temuan tetum thailandese tibetano tigrè tigrino tok pisin tokelauana toki pona tongano tongano (Zambezi) tsonga tswana tuareg tumbuka tupi antico turco turco antico turco ottomano turkmeno tuvaluano tuvano Uab Meto ucraino udmurto uiguro umbundu ungherese urdu urhobo uzbeko vallone veneto vepso vietnamita volapük võro waráy wayuu wolof xhosa yawi yiddish yoruba zazaki zazaki meridionale (Dimli) zazaki settentrionale (Kirmanjki) zelandese zulu Lingua sconosciuta - Descrizione del file
- Contiene dei campi aggiuntivi per ogni frase (nome del proprietario, data di creazione / modifica).
- Campi e struttura
- ID della frase [tab] Lingua [tab] Testo [tab] Nome dell'utente [tab] Data di aggiunta [tab] Data dell'ultima modifica
Frasi originali e frasi tradotte
- Nome del file
- sentences_base.tar.bz2
- Descrizione del file
-
Ogni frase è elencata o come originale, o come traduzione di un'altra frase. Il campo "base" può avere i seguenti valori:
- zero: La frase è originale, non una traduzione di un'altra frase.
- maggiore di zero: L'ID della frase originale che è stata tradotta.
- \N: Sconosciuto (raro).
- Campi e struttura
- ID della frase [tab] Campo base
Frasi (CC0)
- Nome del file
-
tutte le lingue Solo le frasi in arabo arabo algerino aramaico antico aramaico giudaico babilonese aramaico giudaico palestinese bengalese berbero berbero marocchino standard bielorusso cabilo cantonese careliano catalano ceco cinese letterario cinese mandarino danese ebraico ebraico antico esperanto fenicio finlandese francese frisone antico gallese giapponese greco antico hindi ho ido inglese inglese medio interlingua interlingue italiano klingon konkani (goano) kven láadan ladino (America Centrale) latino ligure lingua silotica noongar norreno norvegese bokmål odia (oriya) olandese polacco portoghese russo santali spagnolo svedese tashawit tedesco toki pona ucraino ungherese volapük yiddish Lingua sconosciuta - Descrizione del file
- Contiene tutte le frasi disponibili sotto la licenza CC0.
- Campi e struttura
- ID della frase [tab] Lingua [tab] Testo [tab] Data dell'ultima modifica
Collegamenti
- Nome del file
- links.tar.bz2
- Descrizione del file
- Contiene i collegamenti tra le frasi. 1 [tab] 77 vuole dire che la frase n° 77 è la traduzione della frase n° 1. Anche il collegamento reciproco è presente, per cui il file conterrà anche una riga che dice 77 [tab] 1.
- Campi e struttura
- ID della frase [tab] ID della traduzione
Etichette
- Nome del file
- tags.tar.bz2
- Descrizione del file
- Contiene l'elenco delle etichette associate ad ogni frase. 381279 [tab] proverb vuole dire che alla frase n° 381279 è stata aggiunta l'etichetta "proverb".
- Campi e struttura
- ID della frase [tab] Nome dell'etichetta
Elenchi
- Nome del file
- user_lists.tar.bz2
- Descrizione del file
- Contiene l'elenco degli elenchi di frasi.
- Campi e struttura
- ID dell'elenco [tab] Nome dell'utente [tab] Data di creazione [tab] Data dell'ultima modifica [tab] Nome dell'elenco [tab] Modificabile da
Frasi negli elenchi
- Nome del file
- sentences_in_lists.tar.bz2
- Descrizione del file
- Indica le frasi che sono contenute in qualunque elenco. 13 [tab] 381279 vuole dire che la frase n° 381279 è contenuta nell'elenco che ha come ID 13.
- Campi e struttura
- ID dell'elenco [tab] ID della frase
Indici giapponesi
- Nome del file
- jpn_indices.tar.bz2
- Descrizione del file
- Contiene le equivalenze dei registri indice del file del Tanaka Corpus distribuito da Jim Breen. Consulta questa pagina per avere delle informazioni sul formato. Ogni voce è associata ad una coppia di frasi in giapponese e in inglese. ID della frase si riferisce all'ID della frase giapponese. ID del significato si riferisce all'ID della frase inglese.
- Campi e struttura
- ID della frase [tab] ID del significato [tab] Testo
Frasi con l'audio
- Nome del file
- sentences_with_audio.tar.bz2
- Descrizione del file
- Contiene gli ID delle frasi, in tutte le lingue, per cui è disponibile l'audio. Gli altri campi indicano chi ha registrato l'audio, la sua licenza e un URL per attribuire l'autore. Se il campo della licenza è vuoto, non è possibile riutilizzare l'audio al di fuori di Tatoeba.
- Scaricare i file audio
- Una singola frase può avere uno o più file audio, ognuno con una voce differente. Per scaricare un file in particolare, utilizza il suo ID audio per generare l'URL per il download. Ad esempio, per scaricare il file dall'ID 1234, l'URL è https://tatoeba.org/audio/download/1234.
- Campi e struttura
- ID della frase [tab] ID audio [tab] Nome dell'utente [tab] Licenza [tab] URL per l'attribuzione
Livello di abilità dell'utente per lingua
- Nome del file
- user_languages.tar.bz2
- Descrizione del file
- Indica i livelli di abilità assegnati dagli utenti a se stessi per ogni lingua.
- Campi e struttura
- Lingua [tab] Livello di abilità [tab] Nome dell'utente [tab] Dettagli
Valutazioni delle frasi degli utenti
- Nome del file
- users_sentences.csv
- Descrizione del file
- Contiene le frasi valutate dagli utenti. Il valore della valutazione può essere -1 (frase errata), 0 (se si è indecisi o insicuri) oppure 1 (frase corretta). Avvertimento: questi dati sono ancora sperimentali.
- Campi e struttura
- Nome dell'utente [tab] ID della frase [tab] Valutazione [tab] Data di aggiunta [tab] Data dell'ultima modifica
Traslitterazioni
- Nome del file
-
tutte le lingue Solo le frasi in cantonese cinese mandarino giapponese uzbeko - Descrizione del file
- Contiene tutte le trascrizioni in sistemi di scrittura ausiliari o alternativi. Un nome utente associato a una trascrizione indica l'utente che l'ha valutata per l'ultima volta e possibilmente modificata. Una trascrizione senza nome utente non è stata contrassegnata come valutata. Il nome del sistema di scrittura è definito secondo lo standard ISO 15924.
- Campi e struttura
- ID della frase [tab] Lingua [tab] nome del sistema di scrittura [tab] Nome dell'utente [tab] Trascrizione