menu
Tatoeba
language
নথিভুক্ত হন লগইন করুন
language বাংলা
menu
Tatoeba

chevron_right নথিভুক্ত হন

chevron_right লগইন করুন

ব্রাউজ করুন

chevron_right অজানা যেকোনো বাক্য

chevron_right ভাষা দ্বারা ব্রাউজ করুন

chevron_right তালিকা দ্বারা ব্রাউজ করুন

chevron_right ট্যাগ দ্বারা ব্রাউজ করুন

chevron_right অডিও দ্বারা ব্রাউজ করুন

সম্প্রদায়

chevron_right দেওয়াল

chevron_right সকল সদস্যের তালিকা

chevron_right সদস্যদের ভাষা

chevron_right স্থানীয় বক্তা

search
clear
swap_horiz
search
iopq iopq ২৯ জানুয়ারী, ২০২৩ ২৯ জানুয়ারী, ২০২৩ ১:০৪:৩১ PM UTC flag Report link স্থায়ী সংযোগ

Is there a list of sentences by difficulty? Let's say I wanted to order 500 easiest sentences in Korean, how would do I this?

{{vm.hiddenReplies[39500] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
AlanF_US AlanF_US ২৯ জানুয়ারী, ২০২৩, সম্পাদিত ২৯ জানুয়ারী, ২০২৩ ২৯ জানুয়ারী, ২০২৩ ৩:৩০:১৬ PM UTC, সম্পাদিত ২৯ জানুয়ারী, ২০২৩ ৩:৩২:৪৭ PM UTC flag Report link স্থায়ী সংযোগ

The Tatoeba collection in any language is not fundamentally sorted. You can search through it with a number of criteria (length, creation date), but none of them pertain to difficulty. Assuming a Tatoeba member could come up with a workable measure of difficulty, they could choose to add tags to particular sentences indicating their perceived difficulty, or they could add a list ("500 easiest sentences in Korean") and assign sentences to it. But they couldn't impose a sorting order, such as easiest to hardest, on a set of sentences.

However, Tatoeba makes its sentences freely available, and I know of at least one site, clozemaster.com, that takes these sentences and groups them into categories by frequency of the least common word within a sentence ("100 Most Common", "500 Most Common", and so on). The rareness of the words in a sentence is not the only measure of its difficulty, but it's probably the easiest measure to calculate in that regard.

{{vm.hiddenReplies[39502] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
iopq iopq ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ৮:০১:২১ AM UTC flag Report link স্থায়ী সংযোগ

There's two ways to grade difficulty, either x grade reading level or language level exam level. For example in Korean, if you passed TOPIK test level 3, should be expected to know this sentence or not?

On another note, there's too many lists. I can't possibly see if someone did create a list I'm interested in, there's thousands of them

{{vm.hiddenReplies[39519] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
Cabo Cabo ৩০ জানুয়ারী, ২০২৩, সম্পাদিত ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ২:৫১:১৩ PM UTC, সম্পাদিত ৩০ জানুয়ারী, ২০২৩ ২:৫১:৪৩ PM UTC flag Report link স্থায়ী সংযোগ

Clozemaster sorted the sentences in one way using word frequency lists.
You can do the same by creating a code or ask someone to do the work for you.
In this corpora you can't really sort things the way what is best for your criteria.

{{vm.hiddenReplies[39521] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
CK CK ৩০ জানুয়ারী, ২০২৩, সম্পাদিত ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ৫:১০:৫০ PM UTC, সম্পাদিত ৩০ জানুয়ারী, ২০২৩ ৫:২২:২৭ PM UTC flag Report link স্থায়ী সংযোগ

◼ For English sentences sorted by vocabulary levels, you can try these lists.

CK's OGTE-Level Lists
http://goo.gl/BnPz6h

Created in 2017.

{{vm.hiddenReplies[39522] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
AlanF_US AlanF_US ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ৭:২১:২৭ PM UTC flag Report link স্থায়ী সংযোগ

Reading between the lines:

CK probably used the Online Graded Text Editor (OGTE), a tool that assigns English text a level based on the vocabulary it contains, in order to classify English sentences and assign them to lists that he produced on Tatoeba. Naturally, this doesn't suit your needs directly, since you want Korean text, not English. However, you could presumably look for sentences within these lists that contain Korean translations, assuming that the classification of vocabulary difficulty for the Korean sentences will match those for the English sentences. Alternatively, if you can find such a classification tool for Korean, know how to program, and have a lot of time and motivation, you can do the same kind of thing for Korean that CK did for English. That's a big "if".

As for looking through the lists on Tatoeba, it's true that there are a lot, but you can search through the titles of the lists. I did a search for "TOPIK" and for "Korean", but didn't find anything useful.

If you want to use Tatoeba-sourced sentences, it looks like Clozemaster is probably your best alternative.

{{vm.hiddenReplies[39523] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
CK CK ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ১১:০৮:৩৮ PM UTC flag Report link স্থায়ী সংযোগ

> CK probably used the Online Graded Text Editor (OGTE), a tool that assigns English text a level based on the vocabulary

That's right, as the 2nd sentence on that page says, ...

These lists were created based only on vocabulary, using er-central.com/ogte, so some of the sentences will use grammar and idioms that are above the level of the lists.

Yorwba Yorwba ৩০ জানুয়ারী, ২০২৩ ৩০ জানুয়ারী, ২০২৩ ৯:০৬:৫৪ PM UTC flag Report link স্থায়ী সংযোগ

Since I already had a list of Korean sentences sorted by word frequency, I uploaded the first 500: https://tatoeba.org/en/sentence...&direction=asc

Each sentence contains at least one word that doesn't appear in any of the 499 other sentences, so they're definitely not the 500 easiest ones (which likely contain a lot of repetition) but maybe you'll find the list useful nonetheless.

Thanuir Thanuir ৩১ জানুয়ারী, ২০২৩ ৩১ জানুয়ারী, ২০২৩ ৯:০৫:০৫ AM UTC flag Report link স্থায়ী সংযোগ

Ankissa on Tatoebasta (ilman mainintaaa) haettuja ja järjestettetyjä lauseita sisältävä pakka: https://ankiweb.net/shared/info/241481292

Sama henkilö on tehnyt useita vastaavia eikä mainitse Tatoebaa, mutta valtava Tom- ja Mary-lauseiden määrä paljastaa lähteen. https://frequencylists.blogspot.com/

{{vm.hiddenReplies[39526] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
mollydot mollydot ৩ ফেব্রুয়ারী, ২০২৩ ৩ ফেব্রুয়ারী, ২০২৩ ৩:৩২:৪৯ PM UTC flag Report link স্থায়ী সংযোগ

I also believe she is using machine translation. I queried a few short Finnish ones with native Finns, and the English translations were bad.

{{vm.hiddenReplies[39528] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
Thanuir Thanuir ৩ ফেব্রুয়ারী, ২০২৩ ৩ ফেব্রুয়ারী, ২০২৩ ৫:১১:১০ PM UTC flag Report link স্থায়ী সংযোগ

Ehkä. Olen kuitenkin löytänyt muutaman kirjoitusvirheen tanskankielisissä lauseissa tuollaisen pakan kautta.

Epäilen sen johtuvan enemmän siitä, että Tatoeba, varsinkaan vanhempien lauseiden ja pienempien kielten kohdalla, ei aina ole laadukas. Mutta ehkä siellä on konekäännöksiäkin, en siitä tiedä.

ssvb ssvb ১১ ফেব্রুয়ারী, ২০২৩ ১১ ফেব্রুয়ারী, ২০২৩ ১:০৭:৪৩ AM UTC flag Report link স্থায়ী সংযোগ

> I also believe she is using machine translation. I queried a few short Finnish ones with native Finns, and the English translations were bad.

Are these bad sentences also present in the tatoeba database? If that's the case, then is anyone doing anything to remove or fix them?

{{vm.hiddenReplies[39537] ? 'expand_more' : 'expand_less'}} প্রত্যুত্তর লুকান show replies
Thanuir Thanuir ১১ ফেব্রুয়ারী, ২০২৩ ১১ ফেব্রুয়ারী, ২০২৩ ৮:১১:৩৫ AM UTC flag Report link স্থায়ী সংযোগ

https://tatoeba.org/es/tags/sho...th_tag/561/fin - suomenkieliset lauseet, joita pitäisi muokata. Osa on ollut listalla pitkään. Ehkä pitäisi itse pyytää muokkausoikeuksia niihin, koska kukaan ei näytä niitä muuten korjaavan.

En tiedä, ovatko mainitut lauseet tunnisteella merkittyjä, tokikaan.