인프런 커뮤니티 질문&답변

illuminatop님의 프로필 이미지
illuminatop

작성한 질문수

R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지)

Top Keyword 추출

사전에 단어 등록하는 방법 문의

작성

·

769

2

안녕하세요. 코코님.
좋은 강의 항상 감사합니다.

강의중 좋은 예시가 있었던 것 같아서요. '롯데마트가' 를 명사로 인식했는데요. '롯데마트' 가 명사로 등록되어있지 않아서 그런 것 같은데, '롯데마트' 처럼 특정 단어를 명사로 인식되게 하려면 어떻게 해야 될까요? buildDictionary 함수를 통해 단어를 추가했는데, 정작 extractNoun이나, SimplePos 함수를 돌려보면, 결과가 바뀌지 않아서요. 확인 부탁드릴게요. 감사합니다.

답변 4

2

illuminatop님의 프로필 이미지
illuminatop
질문자

빠른 답변 감사합니다.
제가 계속 사전에 추가한 단어만으로 테스트를 해서 적용이 안되는 줄 알았는데, 문장 형태에서는 적용이 되네요.

등록한 단어(명사)를 단독으로 아래와 같이
extrancNoun('인프런')을 실행하면,

'인프', '런' 이렇게 결과가 나오는데, 이 부분도 '인프런'이란 결과가 나오게 할 수 있을까요?

__________

내용 추가합니다.
이게 꼭 사용자 사건에 추가된 것 뿐만 아니라,
기존의 등록된 명사에서도 동일하네요.

좌측이 입력한 문장, 우측이 extractNoun 결과 입니다.

사진속에 보이는 아파트에 살고 있다 : 사진/속/아파트/있

사진속에 보이는 아파트 : 사진/속/트

사진 : 진

아파트 : 트

이미 명사인 것은 더이상 쪼개지 않도록 설정을 할 수 있을까요?

1

illuminatop님의 프로필 이미지
illuminatop
질문자

혼자서 구글링 하며 찾던 부분이 코코님 덕분에 해결이 되었네요. 정말 감사합니다. 제가 보려는 데이터가 미완결 문장, 단어의 나열형태로 들어오다보니 문제가 되었었는데요. 알려주신 방향으로 하면 될 것 같습니다. 감사합니다.

1

코코님의 프로필 이미지
코코
지식공유자

extractnoun의 함수 설명법을 보면 input이 sentence입니다.

즉,  input이 완성된 문장이라는 전제하에 함수가 적용이 되는 것같습니다.

그래서 문장의 마지막 단어는 명사가 아니라는 규칙이 먼저 적용되는 것 같습니다.

아래 코드를 보시면 인프런이란 단어를 여러개 썼을때 마지막 인프런 단어만 이상하게 잘리는 것을 볼수 있습니다.

강제적으로 마지막word에 대해서도 위규칙이 적용되지 않게 하기위해 아래코드처럼 '이다'와 같은 단어를 붙여서 하는 방법을

생각해 볼 수 있을것 같습니다.  

x<-c("인프런 인프런","사진속에 보이는 아파트")

extractNoun(x)

extractNoun(paste0(x,"이다"))

1

코코님의 프로필 이미지
코코
지식공유자

안녕하세요. illuminatop 님

다음과 같이 buildDictionary함수를 이용해서 사전에 추가하시면 사용이 가능합니다.

추가하실때는 tag를 이용해서 품사를 지정해주셔야합니다.

illuminatop님의 프로필 이미지
illuminatop

작성한 질문수

질문하기