사전에 단어 등록하는 방법 문의

Question

안녕하세요. 코코님.
좋은 강의 항상 감사합니다.

강의중 좋은 예시가 있었던 것 같아서요. '롯데마트가' 를 명사로 인식했는데요. '롯데마트' 가 명사로 등록되어있지 않아서 그런 것 같은데, '롯데마트' 처럼 특정 단어를 명사로 인식되게 하려면 어떻게 해야 될까요? buildDictionary 함수를 통해 단어를 추가했는데, 정작 extractNoun이나, SimplePos 함수를 돌려보면, 결과가 바뀌지 않아서요. 확인 부탁드릴게요. 감사합니다.

illuminatop · Answer

빠른 답변 감사합니다. 제가 계속 사전에 추가한 단어만으로 테스트를 해서 적용이 안되는 줄 알았는데, 문장 형태에서는 적용이 되네요. 등록한 단어(명사)를 단독으로 아래와 같이 extrancNoun('인프런')을 실행하면, '인프', '런' 이렇게 결과가 나오는데, 이 부분도 '인프런'이란 결과가 나오게 할 수 있을까요? __________ 내용 추가합니다. 이게 꼭 사용자 사건에 추가된 것 뿐만 아니라, 기존의 등록된 명사에서도 동일하네요. 좌측이 입력한 문장, 우측이 extractNoun 결과 입니다. 사진속에 보이는 아파트에 살고 있다 : 사진/속/아파트/있 사진속에 보이는 아파트 : 사진/속/트 사진 : 진 아파트 : 트 이미 명사인 것은 더이상 쪼개지 않도록 설정을 할 수 있을까요?

illuminatop · Answer

혼자서 구글링 하며 찾던 부분이 코코님 덕분에 해결이 되었네요. 정말 감사합니다. 제가 보려는 데이터가 미완결 문장, 단어의 나열형태로 들어오다보니 문제가 되었었는데요. 알려주신 방향으로 하면 될 것 같습니다. 감사합니다.

코코 · Answer

extractnoun의 함수 설명법을 보면 input이 sentence입니다. 즉, input이 완성된 문장이라는 전제하에 함수가 적용이 되는 것같습니다. 그래서 문장의 마지막 단어는 명사가 아니라는 규칙이 먼저 적용되는 것 같습니다. 아래 코드를 보시면 인프런이란 단어를 여러개 썼을때 마지막 인프런 단어만 이상하게 잘리는 것을 볼수 있습니다. 강제적으로 마지막word에 대해서도 위규칙이 적용되지 않게 하기위해 아래코드처럼 '이다'와 같은 단어를 붙여서 하는 방법을 생각해 볼 수 있을것 같습니다. x<-c("인프런 인프런","사진속에 보이는 아파트") extractNoun(x) extractNoun(paste0(x,"이다"))

코코 · Answer

안녕하세요. illuminatop 님 다음과 같이 buildDictionary함수를 이용해서 사전에 추가하시면 사용이 가능합니다. 추가하실때는 tag를 이용해서 품사를 지정해주셔야합니다.