menu
Tatoeba
language
Đăng ký Đăng nhập
language Tiếng Việt
menu
Tatoeba

chevron_right Đăng ký

chevron_right Đăng nhập

Duyệt

chevron_right Hiện câu ngẫu nhiên

chevron_right Duyệt theo ngôn ngữ

chevron_right Duyệt theo danh sách

chevron_right Duyệt theo thẻ

chevron_right Duyệt âm thanh

Cộng đồng

chevron_right Tường

chevron_right Danh sách thành viên

chevron_right Ngôn ngữ thành viên

chevron_right Người bản xứ

search
clear
swap_horiz
search
sharptoothed sharptoothed 4 tháng 5, 2020, đã chỉnh sửa 4 tháng 5, 2020 09:38:03 UTC 4 tháng 5, 2020, đã chỉnh sửa 10:40:15 UTC 4 tháng 5, 2020 flag Report link Permalink

* Tatoeba Top 30 Languages For 14 Days *

Tatoeba Top 30 Languages For 14 Days Interactive Graph has been updated:
https://tatoeba.j-langtools.com.../index-14.html

{{vm.hiddenReplies[35075] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
Julien_PDC Julien_PDC 4 tháng 5, 2020 17:43:14 UTC 4 tháng 5, 2020 flag Report link Permalink

Thank you, good job !

{{vm.hiddenReplies[35092] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
sharptoothed sharptoothed 5 tháng 5, 2020 13:23:21 UTC 5 tháng 5, 2020 flag Report link Permalink

Thanks! :-)

AmarMecheri AmarMecheri 4 tháng 5, 2020, đã chỉnh sửa 4 tháng 5, 2020 19:34:45 UTC 4 tháng 5, 2020, đã chỉnh sửa 19:40:23 UTC 4 tháng 5, 2020 flag Report link Permalink

@Sharptoothed
Many thanks.
I am really happy and proud that Kabyle is the first during these 14 days. I also participated to the score of French and English (thanks to @AlanF_US who helped me so many times) since I always translate my Kabyle sentences to make them visible, and with the goal of better comprehension with the other languages. I don't manage Russian as well. That's a pity! But I did my best.
Greetings

{{vm.hiddenReplies[35093] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
belkacem77 belkacem77 4 tháng 5, 2020 20:41:16 UTC 4 tháng 5, 2020 flag Report link Permalink

Some job has to be done to recruit more contribs for Kab. We are still late. We need more to launch other projects, MT among them. Isn't it?

{{vm.hiddenReplies[35095] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
AmarMecheri AmarMecheri 4 tháng 5, 2020 21:54:34 UTC 4 tháng 5, 2020 flag Report link Permalink

@belkacem77
You are right.
Unfortunately, I am too old to learn a little more computing science than my out-of-date Apple Basic (of the 1980s).

sharptoothed sharptoothed 5 tháng 5, 2020 13:23:57 UTC 5 tháng 5, 2020 flag Report link Permalink

Thanks a lot! :-)

{{vm.hiddenReplies[35101] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
AmarMecheri AmarMecheri 6 tháng 5, 2020 17:17:37 UTC 6 tháng 5, 2020 flag Report link Permalink

@Sharptoothed
Tanemmirt sɣuṛ-i.
It's up to me to thank you.
C'est moi qui vous remercie.

soliloquist soliloquist 5 tháng 5, 2020 12:21:45 UTC 5 tháng 5, 2020 flag Report link Permalink

Thank you.

Could you provide the statistics for proofreading ratios (both cumulative and individual)? I mean the ratio of sentences that are rated or tagged OK to the total number of sentences.

{{vm.hiddenReplies[35098] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
sharptoothed sharptoothed 5 tháng 5, 2020 13:22:35 UTC 5 tháng 5, 2020 flag Report link Permalink

It's possible adding such a ratio to "Tatoeba Sentences & Translations Stats" chart but I'm not sure if it's valuable. For example, in Russian part of the corpus we usually don't mark sentences with OK tag unless they were added by a non-native. This means that only some of the sentences are tagged OK. I suspect the same is in other parts of the corpus too.

{{vm.hiddenReplies[35099] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 5 tháng 5, 2020 19:54:17 UTC 5 tháng 5, 2020 flag Report link Permalink

I previously calculated comment/sentence ratios of some languages and Russian was one of the highest ones, so I assume it's well-maintained and review marks may be trivial for you, but I think it's essential for the Turkish corpus. We have a lot of unnatural sentences added by native speakers. Monitoring the proofreading progress is therefore important and valuable for us, and the same may go for others. Having this information may also encourage users to rate/tag sentences which I think is beneficial for the overall quality of the Tatoeba corpus.

Anyway, I tried to work out the ratio for the Turkish corpus and left it as a comment on #8739923. I may update it from time to time to show the progress.

{{vm.hiddenReplies[35103] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 5 tháng 5, 2020, đã chỉnh sửa 6 tháng 5, 2020 19:55:45 UTC 5 tháng 5, 2020, đã chỉnh sửa 04:08:40 UTC 6 tháng 5, 2020 flag Report link Permalink

And here are the ratios for the top ten languages. (as of May 2nd)

English: 58.14%
Russian: 2.39%
Italian: 5.3%
Turkish: 3.06%
Esperanto: 23.6%
German: 2.81%
French: 1.62%
Portuguese: 3.96%
Spanish: 1.46%
Hungarian: 9.21%

* Sentences that are both tagged and rated OK, and sentences that are rated by multiple users are counted once.
* Sentences that have mixed rate marks (green-yellow or green-red) are not excluded.
* Self-approvals are not excluded.

sharptoothed sharptoothed 6 tháng 5, 2020 09:56:31 UTC 6 tháng 5, 2020 flag Report link Permalink

OK, I'll try adding OK ratio to my chart.

{{vm.hiddenReplies[35112] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 6 tháng 5, 2020 19:36:58 UTC 6 tháng 5, 2020 flag Report link Permalink

Thanks a lot. :-)

{{vm.hiddenReplies[35114] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
sharptoothed sharptoothed 7 tháng 5, 2020 08:54:50 UTC 7 tháng 5, 2020 flag Report link Permalink

Please, take a look :-)
https://tatoeba.j-langtools.com/transtop

{{vm.hiddenReplies[35115] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 7 tháng 5, 2020, đã chỉnh sửa 7 tháng 5, 2020 10:34:29 UTC 7 tháng 5, 2020, đã chỉnh sửa 10:35:27 UTC 7 tháng 5, 2020 flag Report link Permalink

Thank you very much. My OK ratios are a bit higher than yours. I guess yours include the OK-rated (green marked) sentences, but not the OK-tagged ones. I had tried to add them together and remove the duplicates to avoid counting both tagged and rated sentences twice.

{{vm.hiddenReplies[35116] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
sharptoothed sharptoothed 7 tháng 5, 2020 11:22:09 UTC 7 tháng 5, 2020 flag Report link Permalink

I count both OK-tagged and OK-rated sentences but if a sentence has multiple OK-ratings, it counted only once. If a sentence has both OK-tag and OK-rating, it counted once as well.

{{vm.hiddenReplies[35117] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 7 tháng 5, 2020, đã chỉnh sửa 7 tháng 5, 2020 20:36:20 UTC 7 tháng 5, 2020, đã chỉnh sửa 20:38:41 UTC 7 tháng 5, 2020 flag Report link Permalink

According to your chart, 5948 Hungarian and only 3 Hebrew sentences are OK, but the advanced search shows many more sentences that are tagged OK.

https://tatoeba.org/eng/sentenc...&sort_reverse= (20,613 results)

https://tatoeba.org/eng/sentenc...&sort_reverse= (124 results)

{{vm.hiddenReplies[35121] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
sharptoothed sharptoothed 8 tháng 5, 2020 07:31:26 UTC 8 tháng 5, 2020 flag Report link Permalink

It was a bug in my script. :-( Now the results should be better.

{{vm.hiddenReplies[35124] ? 'expand_more' : 'expand_less'}} ẩn câu trả lời hiển thị câu trả lời
soliloquist soliloquist 8 tháng 5, 2020 08:03:07 UTC 8 tháng 5, 2020 flag Report link Permalink

Everything seems fine now. Thank you for implementing that category.