이런 질문을 드려도 되는지 모르겠습니다
은전한닢에서 아래 단어들을 타이핑 했을 때 검색 결과값이 궁금합니다
저희가 현재 사용하고 있는 검색엔진의 결과(형태소가 분절이 잘 안되는 듯해요)
가 너무 안나와서 엘라스틱+은전한닢을 고려 중입니다.
아래와 같은 키워드를 넣었을 때 발견하고 싶은 컨텐츠를 찾을 수 있을까요?
아니면 어떤 작업들이 필요한지요..
대부분 띄어쓰기와 붙여쓰기의 문제들입니다.
저희 현재 엔진에서는 전부 검색이 안되요…
저는 프로그래머는 아니고 기획자인데… 궁금해서요
회사에 의견을 넣어보려고 합니다.
#!/usr/bin/env bash
ESIDX='seunjeon-idx'
curl -XPUT ${ES}/${ESIDX}/?pretty -d '{
"settings" : { "index":{ "analysis":{ "analyzer":{ "korean":{ "type":"custom", "char_filter": ["lowercase"], "tokenizer":"seunjeon_default_tokenizer" } }, "char_filter": { "lowercase": { "type": "mapping", "mappings": [ "A=>a", "B=>b", "C=>c", "D=>d", "E=>e", "F=>f", "G=>g", "H=>h", "I=>i", "J=>j", "K=>k", "L=>l", "M=>m", "N=>n", "O=>o", "P=>p", "Q=>q", "R=>r", "S=>s", "T=>t", "U=>u", "V=>v", "W=>w", "X=>x", "Y=>y", "Z=>z"] } }, "tokenizer": { "seunjeon_default_tokenizer": { "type": "seunjeon_tokenizer", "user_words": ["abc마트"] } } } } }}'
sleep 1
echo "========================================================================"curl -XGET ${ES}/${ESIDX}/_analyze?analyzer=korean\&pretty -d 'Abc마트'
curl -XPUT ${ES}/${ESIDX}/?pretty -d '{ "settings" : { "index":{ "analysis":{ "analyzer":{ "korean":{ "type":"custom", "char_filter": [ "nfc_cf_normalizer" ], "tokenizer":"seunjeon_default_tokenizer" } }, "char_filter": { "nfc_cf_normalizer": { "type": "icu_normalizer" } }, "tokenizer": { "seunjeon_default_tokenizer": { "type": "seunjeon_tokenizer", "user_words": ["낄끼빠빠,-100", "버카충", "abc마트"] } } } } }}'