inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지)

Top Keyword 추출

사전에 단어 등록하는 방법 문의

962

illuminatop

작성한 질문수 1

2

안녕하세요. 코코님.
좋은 강의 항상 감사합니다.

강의중 좋은 예시가 있었던 것 같아서요. '롯데마트가' 를 명사로 인식했는데요. '롯데마트' 가 명사로 등록되어있지 않아서 그런 것 같은데, '롯데마트' 처럼 특정 단어를 명사로 인식되게 하려면 어떻게 해야 될까요? buildDictionary 함수를 통해 단어를 추가했는데, 정작 extractNoun이나, SimplePos 함수를 돌려보면, 결과가 바뀌지 않아서요. 확인 부탁드릴게요. 감사합니다.

웹-크롤링 R 텍스트마이닝

답변 4

2

illuminatop

빠른 답변 감사합니다.
제가 계속 사전에 추가한 단어만으로 테스트를 해서 적용이 안되는 줄 알았는데, 문장 형태에서는 적용이 되네요.

등록한 단어(명사)를 단독으로 아래와 같이
extrancNoun('인프런')을 실행하면,

'인프', '런' 이렇게 결과가 나오는데, 이 부분도 '인프런'이란 결과가 나오게 할 수 있을까요?

__________

내용 추가합니다.
이게 꼭 사용자 사건에 추가된 것 뿐만 아니라,
기존의 등록된 명사에서도 동일하네요.

좌측이 입력한 문장, 우측이 extractNoun 결과 입니다.

사진속에 보이는 아파트에 살고 있다 : 사진/속/아파트/있

사진속에 보이는 아파트 : 사진/속/트

사진 : 진

아파트 : 트

이미 명사인 것은 더이상 쪼개지 않도록 설정을 할 수 있을까요?

1

illuminatop

혼자서 구글링 하며 찾던 부분이 코코님 덕분에 해결이 되었네요. 정말 감사합니다. 제가 보려는 데이터가 미완결 문장, 단어의 나열형태로 들어오다보니 문제가 되었었는데요. 알려주신 방향으로 하면 될 것 같습니다. 감사합니다.

1

코코

extractnoun의 함수 설명법을 보면 input이 sentence입니다.

즉,  input이 완성된 문장이라는 전제하에 함수가 적용이 되는 것같습니다.

그래서 문장의 마지막 단어는 명사가 아니라는 규칙이 먼저 적용되는 것 같습니다.

아래 코드를 보시면 인프런이란 단어를 여러개 썼을때 마지막 인프런 단어만 이상하게 잘리는 것을 볼수 있습니다.

강제적으로 마지막word에 대해서도 위규칙이 적용되지 않게 하기위해 아래코드처럼 '이다'와 같은 단어를 붙여서 하는 방법을

생각해 볼 수 있을것 같습니다.  

x<-c("인프런 인프런","사진속에 보이는 아파트")

extractNoun(x)

extractNoun(paste0(x,"이다"))

1

코코

안녕하세요. illuminatop 님

다음과 같이 buildDictionary함수를 이용해서 사전에 추가하시면 사용이 가능합니다.

추가하실때는 tag를 이용해서 품사를 지정해주셔야합니다.

셀레늄 실습중 문의

0

807

1

ADP 자격증 대비 강의 개설 문의

0

809

2

멜론편 진행하고 있는데 배너 닫는 버튼이 안보이네요.

0

634

2

옵션 선택에 따른 크롤링

0

740

1

셀레니움으로 네이버를 열고나서 갑자기 data;라는 주소로 바뀌고 내용이 사라집니다.

0

1271

2

ImportError: cannot import name 'webdriver' from partially initialized module 'selenium' 에러

0

2222

1

검색어 입력 관련

1

505

3

광고상품 외 표기 문의드립니다.

2

424

2

광고 상품 표기 추가문의

0

270

1

광고상품 표기외에 상품명도 보려고 하는데요. 에러가나네요.

1

446

1

R 오류

0

374

0

mac KoNLP 설치 오류

0

2005

1

워드클라우드 해상도

0

916

1

"try-error"

0

269

0

코드 에러

0

1190

1

같은 라인에서 두 개의 텍스트가 추출될 때

0

238

0

utf-8로 바꾸기

0

315

3

R 4버전 이상에는 KoNLP를 지원 안하네요... ㅠㅠ

0

1549

3

긍정과 부정이 아닌 7가지 감정으로 분석하려면 어떻게 해야 하나요?

0

411

1

KoNLP 설치 관련 질문

0

458

3

감성분석 질의

0

377

2

코드 이해가 안가서 질문드립니다.

0

311

2

버퍼링

0

267

1

강의 예제자료 불일치

0

441

4