menu
타토에바
language
회원 가입 로그인
language 한국어
menu
타토에바

chevron_right 회원 가입

chevron_right 로그인

검색하기

chevron_right Show random sentence

chevron_right 언어로 검색하기

chevron_right 리스트로 검색하기

chevron_right 태그로 검색하기

chevron_right 오디오로 검색하기

커뮤니티

chevron_right 담벼락

chevron_right 전체 회원 리스트

chevron_right 회원들이 쓰는 언어

chevron_right 원어민

search
clear
swap_horiz
search
Wezel Wezel 2016년 12월 18일, 수정된 때 2016년 12월 18일 2016년 12월 18일 오전 12시 27분 24초 UTC, 수정된 때 2016년 12월 18일 오전 1시 41분 57초 UTC link Permalink

Bug (?)

Searching for "påse" in "any language" yields, besides Swedish, some unexpected results in Turkish.
https://tatoeba.org/eng/sentenc...rom=und&to=und
http://i.imgur.com/mWYmHkM.png
http://i.imgur.com/GtXMpy1.png

{{vm.hiddenReplies[27797] ? 'expand_more' : 'expand_less'}} 답변 숨기기 답변 보이기
AlanF_US AlanF_US 2016년 12월 18일, 수정된 때 2016년 12월 18일 2016년 12월 18일 오후 7시 15분 48초 UTC, 수정된 때 2016년 12월 18일 오후 7시 16분 28초 UTC link Permalink

That's interesting behavior, but it shouldn't get in anyone's way. People can get reasonable results by restricting the search as follows:

- From: Swedish; Search: påse
- From: Any language; Search: *påse*
- From: Any language; Search: =påse

People searching in Turkish would presumably not use the å character.

Apparently, the Turkish stemmer (software that tries to condense multiple forms of a particular word) converts the "på" part of the string into something that matches "bunu", "bindim", and so on, and the "se" part of the string into something that matches "senden", "senin", and so on. Note that the stemmer was not developed by us, or even by the developers of Sphinx, the search engine that we use. It was contributed by someone named Evren Çilden to a project called Snowball that Sphinx uses.

In case anyone is curious, here's a link to the stemmer:

https://raw.githubusercontent.c...em_Unicode.sbl

{{vm.hiddenReplies[27800] ? 'expand_more' : 'expand_less'}} 답변 숨기기 답변 보이기
Wezel Wezel 2016년 12월 18일 2016년 12월 18일 오후 8시 21분 28초 UTC link Permalink

Thank you, that’s interesting.