menu
Tatoeba
language
S'inscrire Se connecter
language Français
menu
Tatoeba

chevron_right S'inscrire

chevron_right Se connecter

Parcourir

chevron_right Montrer une phrase au hasard

chevron_right Parcourir par langue

chevron_right Parcourir par liste

chevron_right Parcourir par étiquette

chevron_right Parcourir les enregistrements sonores

Communauté

chevron_right Mur

chevron_right Liste de tous les membres

chevron_right Langues des membres

chevron_right Langues natales des membres

search
clear
swap_horiz
search

Note

Les données que vous trouverez ici ne vous seront PAS utiles à moins que vous codiez un outil pour les langues ou que vous effectuiez des traitements sur les données.

Si vous voulez juste des phrases utilisables pour apprendre une langue, jetez un œil aux listes de phrases. Vous pouvez élaborer vos propres listes, ou consulter celles créées par les autres. Les listes peuvent être téléchargées et imprimées.

Information générale à propos des fichiers

Bon nombre des phrases japonaises et anglaises sont issues du corpus de Tanaka, qui appartient au domaine public.

Creative commons

Ces fichiers sont publiés sous licence CC BY 2.0 FR.

Creative Commons License CC-BY

Une partie de nos phrases est également disponible sous licence CC0 1.0

Creative Commons License CC0

Licences couvrant les enregistrements sonores

La licence couvrant un fichier audio est choisie par le contributeur, et est indiquée sur la page listant les fichiers audios qu'il ou elle a fourni.

Des questions ?

Si vous avez des questions ou des requêtes, n'hésitez pas à nous contacter. Nous répondons généralement rapidement.

Téléchargements

arrow_back

Exports personnalisés

Paires de phrases

Utilisez cet outil pour générer et télécharger des exports personnalisés à la demande.

translate Paires de phrases
Télécharger toutes les phrases d'une langue A avec les traductions d'une langue B

Télécharger toutes les phrases dans une langue A qui sont traduites dans une langue B, avec les traductions.

Exports hebdomadaires

info Les fichiers fournis ci-dessous sont mis à jour tous les samedis à 6 heures 30 du matin (UTC).

Phrases

Nom de fichier

{{sentences | filename}}

toutes les langues
Seulement les phrases en : abkhaze adyguéen afrihili afrikaans aïnou aklanon albanais albanais guègue allemand allemand de Pennsylvanie allemand palatin altaï du Sud amazighe standard marocain amharique ancien français anglais anglais pidgin chinois arabe arabe algérien arabe du Golfe arabe égyptien arabe irakien arabe levantin méridional arabe levantin septentrional arabe libyen arabe marocain aragonais assamais asturien avar awadhi aymara azéri bachkir balinais baloutchi bambara banjar bas allemand bas-sorabe basque bavarois baybayanon bengali berbère bhojpuri bichelamar biélorusse bikol central birman birom bodo bosniaque bouriate breton brithenig bulgare cachemiri cachoube cantonais carélien catalan cayuga cébouano chamorro chaoui chavacano cherokee chichewa chinois classique chinois gan chinois hakka chinois jinyu chinois mandarin chinois xiang chinook choctaw cingalais coréen cornique corse créole guadeloupéen créole haïtien créole jamaïcain créole louisianais créole seychellois cri des plaines croate cuyonon CycL danois drents dungan dusun du centre Eastern Armenian écossais émilien erromintxela erzya espagnol espéranto estonien estrémègne evenki éwé féringien fidjien finnois finnois kvène français frioulan frison frison oriental frison septentrional ga gaélique écossais gagaouze galicien gallois garhwali géorgien gilbertin gotique grec grec ancien groenlandais groningois guarani gujarati haïda du Nord haïda du Sud haoussa haut-elfique haut-sorabe hawaïen hébreu hébreu ancien hiligaynon hindi hindi des Fidji hitchiti hmong daw (blanc) hmong njua (vert) ho hongrois hunsrik iakoute iban ido igbo ilocano indonésien ingrien interglossa interlingua interlingue inuktitut irlandais isan islandais italien japonais javanais judéo-araméen babylonien judéo-araméen galiléen juhuri (judéo-tat) k'iche' kabarde kabyle kachkaï kadazan côtier kalmouk kamba kannada kanouri central karakalpak karakhanide karatchaï balkar kazakh kekchi (q'eqchi') khakas khalaj khasi khmer kinande kinyarwanda kirghize kirundi klingon kölsch komi-permiak komi-zyriène konkani (goanais) kotava koumyk kurde central (soranî) Kurde Du Sud kurde septentrional (kurmancî) láadan ladin ladino lakota laotien latgalien latin laz letton ligure limbourgeois lingala lingua franca nova lituanien livonien lojban lombard luganda lushootseed luxembourgeois macédonien madurais maïthili malais (vernaculaire) malais de Kelantan-Pattani malais des Moluques du Nord malaisien malayalam maldivien malgache maltais mambae mandchou mannois maori mapuche marathi mari des montagnes mari oriental marshallais mauricien maya yucatèque meitei micmac minangkabau mingrélien minnan mirandais mnong central mohawk mokcha môn mongol mono (États-Unis) moyen anglais moyen français moyen perse (pehlevi) murut keningau muscogee (creek) naga (tangshang) nahuatl nahuatl d'Orizaba nahuatl de Guerrero nahuatl du Huasteca central napolitain nauruan navajo néerlandais néo-armaéen du Nord-Est néo-mélanésien népalais newari ngeq niuéen nogaï norvégien bokmål norvégien nynorsk novial nuer nuosu nyungar o'odham occitan odia (oriya) ojibwé okinawaïen ossète oudmourte ouïgour ourdou ouzbek pachto pahari mahasu pali paluan pampangan pangasinan papiamento pendjabi (occidental) pendjabi (oriental) persan peul nigérian phénicien picard piémontais pipil polonais portugais pulaar quechua rapanui rendille rifain rohingya romanche romani roumain russe ruthène same du Nord same du Sud samoan samogitien sango sanskrit santali saraiki sarde serbe setswana shanghaïen shona shuswap sicilien silésien sindarin sindhi slovaque slovène somali sotho du Sud souabe soundanais speedwords du monde de Dutton sranan tongo subanon du Sud suédois suisse allemand sumérien swahili swahili du Congo swati sylheti syriaque tachelhit tadjik tagal murut tagalog tahitien talossien talysh tamahaq tamoul tatar tatar de Crimée tchaghataï tchèque tchétchène tchouktche tchouvache télougou temuan tétoum thaï tibétain tigré tigrigna tokelau toki pona tonga (Zambèze) tongien touvinien tsonga tumbuka turc turc ottoman turkmène tuvalu uab meto ukrainien umbundu urhobo vénitien vepse vieil anglais vieil espagnol vietnamien vieux araméen vieux frison vieux norrois vieux prussien vieux saxon vieux slave oriental vieux tupi vieux turc volapük voro wallon waray-waray wayuu wolof xhosa yiddish yoruba zazaki zazaki du Nord (kirmanjki) zazaki du Sud (dimli) zélandais zoulou langue inconnue
Description du fichier
Contient toutes les phrases dans la langue sélectionnée. À chaque phrase est associé un identifiant unique, ainsi qu'un code ISO 639-3.
Champs et structure
Identifiant de la phrase [tabulation] Langue [tabulation] Texte

Phrases détaillées

Nom de fichier

{{sentencesDetailed | filename}}

toutes les langues
Seulement les phrases en : abkhaze adyguéen afrihili afrikaans aïnou aklanon albanais albanais guègue allemand allemand de Pennsylvanie allemand palatin altaï du Sud amazighe standard marocain amharique ancien français anglais anglais pidgin chinois arabe arabe algérien arabe du Golfe arabe égyptien arabe irakien arabe levantin méridional arabe levantin septentrional arabe libyen arabe marocain aragonais assamais asturien avar awadhi aymara azéri bachkir balinais baloutchi bambara banjar bas allemand bas-sorabe basque bavarois baybayanon bengali berbère bhojpuri bichelamar biélorusse bikol central birman birom bodo bosniaque bouriate breton brithenig bulgare cachemiri cachoube cantonais carélien catalan cayuga cébouano chamorro chaoui chavacano cherokee chichewa chinois classique chinois gan chinois hakka chinois jinyu chinois mandarin chinois xiang chinook choctaw cingalais coréen cornique corse créole guadeloupéen créole haïtien créole jamaïcain créole louisianais créole seychellois cri des plaines croate cuyonon CycL danois drents dungan dusun du centre Eastern Armenian écossais émilien erromintxela erzya espagnol espéranto estonien estrémègne evenki éwé féringien fidjien finnois finnois kvène français frioulan frison frison oriental frison septentrional ga gaélique écossais gagaouze galicien gallois garhwali géorgien gilbertin gotique grec grec ancien groenlandais groningois guarani gujarati haïda du Nord haïda du Sud haoussa haut-elfique haut-sorabe hawaïen hébreu hébreu ancien hiligaynon hindi hindi des Fidji hitchiti hmong daw (blanc) hmong njua (vert) ho hongrois hunsrik iakoute iban ido igbo ilocano indonésien ingrien interglossa interlingua interlingue inuktitut irlandais isan islandais italien japonais javanais judéo-araméen babylonien judéo-araméen galiléen juhuri (judéo-tat) k'iche' kabarde kabyle kachkaï kadazan côtier kalmouk kamba kannada kanouri central karakalpak karakhanide karatchaï balkar kazakh kekchi (q'eqchi') khakas khalaj khasi khmer kinande kinyarwanda kirghize kirundi klingon kölsch komi-permiak komi-zyriène konkani (goanais) kotava koumyk kurde central (soranî) Kurde Du Sud kurde septentrional (kurmancî) láadan ladin ladino lakota laotien latgalien latin laz letton ligure limbourgeois lingala lingua franca nova lituanien livonien lojban lombard luganda lushootseed luxembourgeois macédonien madurais maïthili malais (vernaculaire) malais de Kelantan-Pattani malais des Moluques du Nord malaisien malayalam maldivien malgache maltais mambae mandchou mannois maori mapuche marathi mari des montagnes mari oriental marshallais mauricien maya yucatèque meitei micmac minangkabau mingrélien minnan mirandais mnong central mohawk mokcha môn mongol mono (États-Unis) moyen anglais moyen français moyen perse (pehlevi) murut keningau muscogee (creek) naga (tangshang) nahuatl nahuatl d'Orizaba nahuatl de Guerrero nahuatl du Huasteca central napolitain nauruan navajo néerlandais néo-armaéen du Nord-Est néo-mélanésien népalais newari ngeq niuéen nogaï norvégien bokmål norvégien nynorsk novial nuer nuosu nyungar o'odham occitan odia (oriya) ojibwé okinawaïen ossète oudmourte ouïgour ourdou ouzbek pachto pahari mahasu pali paluan pampangan pangasinan papiamento pendjabi (occidental) pendjabi (oriental) persan peul nigérian phénicien picard piémontais pipil polonais portugais pulaar quechua rapanui rendille rifain rohingya romanche romani roumain russe ruthène same du Nord same du Sud samoan samogitien sango sanskrit santali saraiki sarde serbe setswana shanghaïen shona shuswap sicilien silésien sindarin sindhi slovaque slovène somali sotho du Sud souabe soundanais speedwords du monde de Dutton sranan tongo subanon du Sud suédois suisse allemand sumérien swahili swahili du Congo swati sylheti syriaque tachelhit tadjik tagal murut tagalog tahitien talossien talysh tamahaq tamoul tatar tatar de Crimée tchaghataï tchèque tchétchène tchouktche tchouvache télougou temuan tétoum thaï tibétain tigré tigrigna tokelau toki pona tonga (Zambèze) tongien touvinien tsonga tumbuka turc turc ottoman turkmène tuvalu uab meto ukrainien umbundu urhobo vénitien vepse vieil anglais vieil espagnol vietnamien vieux araméen vieux frison vieux norrois vieux prussien vieux saxon vieux slave oriental vieux tupi vieux turc volapük voro wallon waray-waray wayuu wolof xhosa yiddish yoruba zazaki zazaki du Nord (kirmanjki) zazaki du Sud (dimli) zélandais zoulou langue inconnue
Description du fichier
Contient des champs additionnels pour chaque phrase (nom du propriétaire, date de création, date de modification).
Champs et structure
Identifiant de la phrase [tabulation] Langue [tabulation] Texte [tabulation] Nom d'utilisateur [tabulation] Date d'ajout [tabulation] Date de dernière modification

Phrases originales et traduites

Nom de fichier
sentences_base.tar.bz2
Description du fichier
Chaque phrase est listée comme étant originale ou traduite depuis une autre phrase. Le champ "base" peut prendre les valeurs suivantes :
  • zéro : la phrase est originale, ce n'est pas une traduction d'une autre phrase
  • supérieur à zéro : l'identifiant de la phrase depuis laquelle elle a été traduite.
  • \N : inconnu (rare).
Champs et structure
Identifiant de la phrase [tabulation] Champ base

Phrases (CC0)

Nom de fichier

{{sentencesCC0 | filename}}

toutes les langues
Seulement les phrases en : allemand amazighe standard marocain anglais arabe arabe algérien bengali berbère biélorusse cantonais carélien catalan chaoui chinois classique chinois mandarin danois espagnol espéranto finnois finnois kvène français gallois grec ancien hébreu hébreu ancien hindi ho hongrois ido interlingua italien japonais judéo-araméen babylonien judéo-araméen galiléen kabyle klingon láadan ladino latin ligure moyen anglais néerlandais norvégien bokmål nyungar phénicien polonais portugais russe santali suédois sylheti tchèque toki pona ukrainien vieux araméen vieux frison vieux norrois volapük yiddish langue inconnue
Description du fichier
Contient toutes les phrases disponibles sous CC0.
Champs et structure
Identifiant de la phrase [tabulation] Langue [tabulation] Texte [tabulation] Date de dernière modification

Liens

Nom de fichier
links.tar.bz2
Description du fichier
Contient les liens entre les phrases. 1 [tabulation] 77 signifie que la phrase 77 est une traduction de la phrase 1. Le lien réciproque étant également présent, le fichier aura aussi une ligne disant 77 [tabulation] 1.
Champs et structure
Identifiant de la phrase [tabulation] Identifiant de traduction

Étiquettes

Nom de fichier
tags.tar.bz2
Description du fichier
Contient la liste des étiquettes apposées sur chaque phrase. 381279 [tabulation] proverb signifie que l'étiquette « proverb » a été apposée sur la phrase 381279.
Champs et structure
Identifiant de la phrase [tabulation] Étiquette

Listes

Nom de fichier
user_lists.tar.bz2
Description du fichier
Contiens la liste des listes de phrase.
Champs et structure
Identifiant de liste [tabulation] Nom d'utilisateur [tabulation] Date de création [tabulation] Date de dernière modification [tabulation] Nom de la liste [tabulation] Modifiable par

Phrases dans des listes

Nom de fichier
sentences_in_lists.tar.bz2
Description du fichier
Indique les phrases qui sont présentes dans chaque liste. 13 [tabulation] 381279 signifie que la liste qui a l'identifiant 13 comprend la phrase 381279.
Champs et structure
Identifiant de liste [tabulation] Identifiant de la phrase

Repères pour le japonais

Nom de fichier
jpn_indices.tar.bz2
Description du fichier
Contient l'équivalent des « B lines » dans le fichier du corpus de Tanaka distribué par Jim Breen. Consultez cette page pour le format. Chaque entrée est associée avec une phrase anglaise et une phrase japonaise. Identifiant de la phrase se rapporte à l'identifiant de la phrase japonaise. Identifiant de la signification se rapporte à l'identifiant de la phrase anglaise.
Champs et structure
Identifiant de la phrase [tabulation] Identifiant de la signification [tabulation] Texte

Phrases avec enregistrement sonore

Nom de fichier
sentences_with_audio.tar.bz2
Description du fichier
Contient les identifiants des phrases, toutes langues confondues, pour lesquelles un enregistrement sonore disponible. Les autres champs indiquent qui l'a enregistré, sa licence et une URL pour mentionner l'auteur. Si le champ de la licence est vide, vous ne pouvez pas réutiliser l'enregistrement sonore en dehors du projet Tatoeba.
Télécharger les enregistrements sonores
Une phrase peut avoir un ou plusieurs enregistrements sonores, chacun d'une voix différente. Pour télécharger un enregistrement en particulier, utilisez son identifiant pour former l'URL de téléchargement. Par exemple, pour télécharger l'enregistrement ayant comme identifiant 1234, l'URL est https://tatoeba.org/audio/download/1234.
Champs et structure
Identifiant de la phrase [tabulation] Identifiant de l'enregistrement sonore [tabulation] Nom d'utilisateur [tabulation] Licence [tabulation] URL d'attribution

Niveau des utilisateurs par langue

Nom de fichier
user_languages.tar.bz2
Description du fichier
Indique le niveau que les membres affirment avoir dans chacune des langues.
Champs et structure
Langue [tabulation] Niveau [tabulation] Nom d'utilisateur [tabulation] Précisions

Révisions des phrases par les utilisateurs

Nom de fichier
users_sentences.csv
Description du fichier
Contient les phrases révisée par les utilisateurs. La valeur de la révision peut être -1 (phrase pas OK), 0 (indécis ou pas sûr) ou 1 (phrase OK). Attention : ces données sont encore expérimentales.
Champs et structure
Nom d'utilisateur [tabulation] Identifiant de la phrase [tabulation] Révision [tabulation] Date d'ajout [tabulation] Date de dernière modification

Transcriptions

Nom de fichier

{{transcriptions | filename}}

toutes les langues
Seulement les phrases en : cantonais chinois mandarin japonais ouzbek
Description du fichier
Contient toutes les transcriptions dans des écritures alternatives ou auxiliaires. La présence d'un nom d'utilisateur indique l'utilisateur qui l'a vérifié et éventuellement modifié en dernier. Une transcription sans nom d'utilisateur n'a pas été marquée comme vérifiée. Le nom de l'écriture est défini selon le standard ISO 15924.
Champs et structure
Identifiant de la phrase [tabulation] Langue [tabulation] Nom de l’écriture [tabulation] Nom d'utilisateur [tabulation] Transcription