작성
·
184
답변 1
0
안녕하세요 질문 주셔서 감사합니다^^
이경우 형태소 분석기에서 복합명사를 인식하지 못하는 경우인데요.
방법은 2가지가 있습니다.
1.데이터 수집 후 데이터 전처리 부분에서 사용자 사전에서 "국제법"을 복합 명사로 처리되도록 등록 하는 방법
2.데이터 정제 과정에서 "국제"->"국제법"으로 변경한 뒤 "법"단어를 삭제하거나 "법"->"국제법"으로 변경한 뒤 "국제"단어를 삭제하는 방법
개인적으로 데이터 정제를 하실줄 아시니깐 2번째 방법이 좋으실것 같네요.
감사합니다(혹시 시간 되실때 강의 후기도 남겨주시면 제가 큰 힘이 될것 같습니다!)
안녕항세요 선생님
저도 이런 문제가 생겼어요.
고유명사, 복합명사,줄임말 이런 유지해야하는 단어가 너무 많아서 방법1을 사용했는데 사용자사전에서 어떻게 복합명사,고유명사로 처리해야될까요? 예를 들면:
통합놀이센터--통합놀이센터
SNS--SNS
유튜브--유튜브
제가 이렇게 처리하고 형테소 분석후에 설정한단어를 다 없어졌어요.