टिप्पणी
यहां आपको जो डेटा मिलेगा वह तब तक उपयोगी नहीं होगा जब तक कि आप किसी भाषा उपकरण को कोड नहीं कर रहे हों या डेटा को संसाधित नहीं कर रहे हों।
यदि आप केवल ऐसे वाक्य चाहते हैं जिनका उपयोग आप भाषा सीखने के लिए कर सकें, तो वाक्य सूचियां देखें। आप अपना खुद का निर्माण कर सकते हैं, या उन लोगों को देख सकते हैं जिन्हें दूसरों ने बनाया है। सूचियों को डाउनलोड और मुद्रित किया जा सकता है।
फाइलों के बारे में सामान्य जानकारी
जापानी और अंग्रेजी वाक्यों में से कई Tanaka कॉर्पस से हैं, जो सार्वजनिक डोमेन से संबंधित है।
क्रीएटिव कामन्स
ये फाइलें CC BY 2.0 FR के तहत जारी की गई हैं।
हमारे वाक्यों का एक भाग CC0 1.0 के अंतर्गत भी उपलब्ध है।
ऑडियो शामिल करने वाले लाइसेंस
ऑडियो फ़ाइल को कवर करने वाला लाइसेंस योगदानकर्ता द्वारा चुना जाता है, और उस पृष्ठ पर इंगित किया जाता है जो उन ऑडियो फ़ाइलों को सूचीबद्ध करता है जिन्हें उसने योगदान दिया है।
सवाल?
यदि आपके पास प्रश्न या अनुरोध हैं, तो हमसे संपर्क करने में संकोच न करें। सामान्य तौर पर, हम जल्दी से जवाब देते हैं।
डाउनलोड
मांग पर अनुकूलित निर्यात उत्पन्न करने और डाउनलोड करने के लिए इस उपकरण का उपयोग करें।
भाषा A में सभी वाक्य डाउनलोड करें जिनका अनुवाद भाषा B में अनुवाद के साथ किया गया है।
वाक्य
- फाइल का नाम
-
सभी भाषाओं में केवल इस भाषा में वाक्य दिखाएँ: अज्ञात भाषा - फाइल वर्णन
- चयनित भाषा में सभी वाक्य शामिल हैं। प्रत्येक वाक्य एक अद्वितीय आईडी और एक ISO 639-3 भाषा कोड से जुड़ा हुआ है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] भाषा [टैब] पाठ्य
विस्तृत वाक्य
- फाइल का नाम
-
{{sentencesDetailed | filename}}
सभी भाषाओं में केवल इस भाषा में वाक्य दिखाएँ: अज्ञात भाषा - फाइल वर्णन
- प्रत्येक वाक्य के लिए अतिरिक्त फ़ील्ड शामिल हैं (स्वामी का नाम, निर्मित/संशोधित दिनांक)।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] भाषा [टैब] पाठ्य [टैब] उपयोगकर्ता नाम [टैब] जोड़ने का दिनांक [टैब] पिछले परिवर्तन का दिनांक
मूल और अनूदित वाक्य
- फाइल का नाम
- sentences_base.tar.bz2
- फाइल वर्णन
-
प्रत्येक वाक्य को मूल या दूसरे के अनुवाद के रूप में सूचीबद्ध किया गया है। "आधार" फ़ील्ड में निम्न मान हो सकते हैं:
- शून्य: वाक्य मूल है, दूसरे का अनुवाद नहीं।
- शून्य से बड़ा: उस वाक्य की आईडी जिससे इसका अनुवाद किया गया था।
- \N: अज्ञात (दुर्लभ)।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] आधार क्षेत्र
वाक्य (CC0)
- फाइल का नाम
-
सभी भाषाओं में केवल इस भाषा में वाक्य दिखाएँ: अज्ञात भाषा - फाइल वर्णन
- CC0 के अंतर्गत उपलब्ध सभी वाक्यों को समाहित करता है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] भाषा [टैब] पाठ्य [टैब] पिछले परिवर्तन का दिनांक
लिंक
- फाइल का नाम
- links.tar.bz2
- फाइल वर्णन
- वाक्यों के बीच लिंक शामिल हैं। 1 [टैब] 77 का अर्थ है कि वाक्य # 77 वाक्य # 1 का अनुवाद है। पारस्परिक लिंक भी मौजूद है, इसलिए फ़ाइल में एक पंक्ति भी होगी जो कहती है 77 [टैब] 1।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] अनुवाद आईडी
टैग
- फाइल का नाम
- tags.tar.bz2
- फाइल वर्णन
- प्रत्येक वाक्य से जुड़े टैग की सूची शामिल है। 381279 [टैब] proverb का अर्थ है कि वाक्य # 381279 को "कहावत" टैग सौंपा गया है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] टैग का नाम
सूचियाँ
- फाइल का नाम
- user_lists.tar.bz2
- फाइल वर्णन
- वाक्य सूचियों की सूची शामिल है।
- फ़ील्ड और संरचना
- सूची आईडी [टैब] उपयोगकर्ता नाम [टैब] बनाने का दिनांक [टैब] पिछले परिवर्तन का दिनांक [टैब] सूची का नाम [टैब] यह संपादित कर सकते है
सूचियों में वाक्य
- फाइल का नाम
- sentences_in_lists.tar.bz2
- फाइल वर्णन
- उन वाक्यों को इंगित करता है जो किसी भी सूची में शामिल हैं। 13 [टैब] 381279 का अर्थ है कि वाक्य #381279 उस सूची में समाहित है जिसमें 13 की एक आईडी है।
- फ़ील्ड और संरचना
- सूची आईडी [टैब] वाक्य आईडी
जापानी सूचकांक
- फाइल का नाम
- jpn_indices.tar.bz2
- फाइल वर्णन
- जिम ब्रीन द्वारा वितरित Tanaka कॉर्पस फ़ाइल में "बी लाइन्स" के बराबर है। प्रारूप के लिए यह पृष्ठ देखें। प्रत्येक प्रविष्टि जापानी / अंग्रेजी वाक्यों की एक जोड़ी से जुड़ी हुई है। वाक्य आईडी जापानी वाक्य की आईडी को संदर्भित करता है। अर्थ आईडी अंग्रेजी वाक्य की आईडी को संदर्भित करता है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] अर्थ आईडी [टैब] पाठ्य
ऑडियो सहित वाक्य
- फाइल का नाम
- sentences_with_audio.tar.bz2
- फाइल वर्णन
- सभी भाषाओं में वाक्यों की आईडी शामिल है, जिसके लिए ऑडियो उपलब्ध है। अन्य फ़ील्ड इंगित करते हैं कि लेखक को विशेषता देने के लिए ऑडियो, इसका लाइसेंस और एक यूआरएल किसने रिकॉर्ड किया। लायसेंस फ़ील्ड रिक्त है, तो आप Tatoeba प्रोजेक्ट के बाहर ऑडियो का पुन: उपयोग नहीं हो सकता है।
- ऑडियो डाउनलोड हो रहा है
- एक वाक्य में एक या एक से अधिक ऑडियो हो सकते हैं, प्रत्येक एक अलग आवाज से। किसी विशेष ऑडियो को डाउनलोड करने के लिए, डाउनलोड यूआरएल की गणना करने के लिए इसकी ऑडियो आईडी का उपयोग करें। उदाहरण के लिए, आईडी 1234 के साथ ऑडियो डाउनलोड करने के लिए, URL https://tatoeba.org/audio/download/1234 है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] ऑडियो आईडी [टैब] उपयोगकर्ता नाम [टैब] लाइसेंस [टैब] आरोपण यू.आर.एल.
भाषा के अनुसार उपयोगकर्ता का कौशल स्तर
- फाइल का नाम
- user_languages.tar.bz2
- फाइल वर्णन
- अलग-अलग भाषाओं में सदस्यों के स्व-रिपोर्ट किए गए कौशल स्तरों को इंगित करता है।
- फ़ील्ड और संरचना
- भाषा [टैब] कौशल स्तर [टैब] उपयोगकर्ता नाम [टैब] विवरण
उपयोगकर्ताओं की वाक्य समीक्षा
- फाइल का नाम
- users_sentences.csv
- फाइल वर्णन
- इसमें उपयोगकर्ताओं द्वारा समीक्षा किए गए वाक्य शामिल हैं। समीक्षा का मान -1 (वाक्य ठीक नहीं), 0 (अनिश्चित या अनिश्चित), या 1 (वाक्य ठीक) हो सकता है। चेतावनी: यह डेटा अभी भी प्रयोगात्मक है।
- फ़ील्ड और संरचना
- उपयोगकर्ता नाम [टैब] वाक्य आईडी [टैब] समीक्षा [टैब] जोड़ने का दिनांक [टैब] पिछले परिवर्तन का दिनांक
ट्रांसक्रिप्शन
- फाइल का नाम
-
सभी भाषाओं में केवल इस भाषा में वाक्य दिखाएँ: - फाइल वर्णन
- सहायक या वैकल्पिक लिपियों में सभी प्रतिलेखन शामिल हैं। प्रतिलेखन से जुड़ा उपयोगकर्ता नाम उस उपयोगकर्ता को इंगित करता है जिसने अंतिम बार समीक्षा की थी और संभवतः इसे संशोधित किया था। उपयोगकर्ता नाम के बिना एक प्रतिलेखन को समीक्षा के रूप में चिह्नित नहीं किया गया है। स्क्रिप्ट का नाम ISO 15924 मानक के अनुसार परिभाषित किया गया है।
- फ़ील्ड और संरचना
- वाक्य आईडी [टैब] भाषा [टैब] लिपी का नाम [टैब] उपयोगकर्ता नाम [टैब] प्रतिलेखन