강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của illuminatop4894
illuminatop4894

câu hỏi đã được viết

Khai phá dữ liệu văn bản (Text Mining) bằng R (Từ từ khóa hàng đầu đến phân tích cảm xúc)

Khai thác từ khóa hàng đầu

사전에 단어 등록하는 방법 문의

Viết

·

938

2

안녕하세요. 코코님.
좋은 강의 항상 감사합니다.

강의중 좋은 예시가 있었던 것 같아서요. '롯데마트가' 를 명사로 인식했는데요. '롯데마트' 가 명사로 등록되어있지 않아서 그런 것 같은데, '롯데마트' 처럼 특정 단어를 명사로 인식되게 하려면 어떻게 해야 될까요? buildDictionary 함수를 통해 단어를 추가했는데, 정작 extractNoun이나, SimplePos 함수를 돌려보면, 결과가 바뀌지 않아서요. 확인 부탁드릴게요. 감사합니다.

웹-크롤링R텍스트마이닝

Câu trả lời 4

2

illuminatop님의 프로필 이미지
illuminatop
Người đặt câu hỏi

빠른 답변 감사합니다.
제가 계속 사전에 추가한 단어만으로 테스트를 해서 적용이 안되는 줄 알았는데, 문장 형태에서는 적용이 되네요.

등록한 단어(명사)를 단독으로 아래와 같이
extrancNoun('인프런')을 실행하면,

'인프', '런' 이렇게 결과가 나오는데, 이 부분도 '인프런'이란 결과가 나오게 할 수 있을까요?

__________

내용 추가합니다.
이게 꼭 사용자 사건에 추가된 것 뿐만 아니라,
기존의 등록된 명사에서도 동일하네요.

좌측이 입력한 문장, 우측이 extractNoun 결과 입니다.

사진속에 보이는 아파트에 살고 있다 : 사진/속/아파트/있

사진속에 보이는 아파트 : 사진/속/트

사진 : 진

아파트 : 트

이미 명사인 것은 더이상 쪼개지 않도록 설정을 할 수 있을까요?

1

illuminatop님의 프로필 이미지
illuminatop
Người đặt câu hỏi

혼자서 구글링 하며 찾던 부분이 코코님 덕분에 해결이 되었네요. 정말 감사합니다. 제가 보려는 데이터가 미완결 문장, 단어의 나열형태로 들어오다보니 문제가 되었었는데요. 알려주신 방향으로 하면 될 것 같습니다. 감사합니다.

1

coco님의 프로필 이미지
coco
Người chia sẻ kiến thức

extractnoun의 함수 설명법을 보면 input이 sentence입니다.

즉,  input이 완성된 문장이라는 전제하에 함수가 적용이 되는 것같습니다.

그래서 문장의 마지막 단어는 명사가 아니라는 규칙이 먼저 적용되는 것 같습니다.

아래 코드를 보시면 인프런이란 단어를 여러개 썼을때 마지막 인프런 단어만 이상하게 잘리는 것을 볼수 있습니다.

강제적으로 마지막word에 대해서도 위규칙이 적용되지 않게 하기위해 아래코드처럼 '이다'와 같은 단어를 붙여서 하는 방법을

생각해 볼 수 있을것 같습니다.  

x<-c("인프런 인프런","사진속에 보이는 아파트")

extractNoun(x)

extractNoun(paste0(x,"이다"))

1

coco님의 프로필 이미지
coco
Người chia sẻ kiến thức

안녕하세요. illuminatop 님

다음과 같이 buildDictionary함수를 이용해서 사전에 추가하시면 사용이 가능합니다.

추가하실때는 tag를 이용해서 품사를 지정해주셔야합니다.

Hình ảnh hồ sơ của illuminatop4894
illuminatop4894

câu hỏi đã được viết

Đặt câu hỏi