0%

은전한닢 형태소 분석기 사전 사용

은전 한닢 형태소 분석기 사전은 아래의 예와 같이
Preanalysis는 기분석사전처럼 오분석을 방지하기 위해 지정한 결과로 분석을 하는 것
Inflected는 오분석결과를 지정한 결과로 분석하는 것
Compound는 복합명사로 분석할 수 있게
사전에 표기할 수 있다.

은전한닢,0,NNG+NR+NNG,T,은전한닢,Preanalysis,NNG,NNG,은전/NNG/+한/NR/+닢/NNG/*
불태워졌,0,VV+EM+VS+EP,T,불태워졌,Inflected,VV,EP ,불태우/VV/+어/EC/+지/VX/+었/EP/
해수욕장,0,NNG,T ,해수욕장 ,Compound,,,해수/NNG/+욕/NNG/+장/NNG/*
한글NLP with python
mecab에 사용자사전/기분석 추가하기

Elasticsearch에서 개발한 Nori형태소 분석기는 복합명사 사전만을 사용예로 제시되었는데
Mecab-ko-dic을 사용한다고 하니 위와 같이 Preanalsis나 Inflected의 형태의 표기도 사용되는지 확인해봐야 겠다
Nori Analyzer