SDS API를 이용한 한글 검색의 한계
- Get link
- X
- Other Apps
by joviansummer
original STEEMIT post: https://steemit.com/blog/@joviansummer/2bj3ai-sds-api
우선, 스팀잇 포스트 검색에 대한 내용은 아래의 포스트를 참고하시기 바랍니다.
Steemit-Search: 간단한 스팀잇 포스트 검색 웹페이지
좀 시간이 지나긴 했는데, @lyh5926님의 댓글과 관련하여 좀 살펴 보았습니다.
https://steemit.com/hive-196917/@lyh5926/rwk9kw
1. 제목 검색으로 "아태파파", "정주부" 검색시 아무것도 검색이 되지않았던 문제
2. 제목 검색 뿐만 아니라 전체 검색에서도 검색결과 갯수가 적게 나오거나 최근 게시물도 있지만 오래된 게시물이 검색되는 증상
제목 검색에서 검색이 누락되는 이유, 그리고 전체 검색에서도 검색 결과가 빠지는 이유는, SDS API에서 제공하는 검색에 형태소 분석이 없기 때문인 것 같습니다.
예를 들어 "아태파파"가 있는 포스트의 제목을 보면 "아태파파의 운동 이야기" 이런 형태이고 마찬가지로 "정주부" 포스트의 제목도 "정주부의 저녁밥상" 이런 형태입니다. 즉, 제목 검색에서 "아태파파"로 검색하면 나오지 않고 "아태파파의"로 검색하면 나옵니다. 한국어의 조사/어미 등을 구분해서 색인하는 것이 아니라 단순히 단어 단위로 문자열을 색인하기 때문입니다.
SDS API에 버그가 있다기보다는(물론 있을 수도 있겠지만) 형태소 분석이 없기 때문에 발생하는 문제라고 생각됩니다. 그러므로, 한글 검색에는 분명한 제약이 있으며 검색하실 때도 이를 감안해서 검색어를 입력해야겠습니다.
@lyh5926
@h4lab
@joviansummer의 스팀 프로젝트
스팀 증인노드를 운영중입니다. @jswit에 증인투표해 주시면 감사하겠습니다.
(https://steemitwallet.com/~witnesses)
jsup 서비스에 큐레이션 보상 분배 기능이 추가되었습니다.
- Get link
- X
- Other Apps
Comments
Post a Comment