• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

보통명사 추출하기

24.01.19 11:25 작성 조회수 100

0

안녕하세요

 

저는 선생님 강의도 듣고, 블로그도 보면서 보통명사 추출하는 함수를 생성해서 tm패키지를 활용해 코퍼스로 변환하는 내용을 공부하고 있습니다~

 

커스텀함수는 이렇게 입력하고

words<-function(text){

text<- as.character(text)

extractNoun(text)

 

이후 변환을 하려고 하는데

doc<- TermDocumentMatrix(doc,

control = list(

tokenize= words

removeNumbers =T

removePunctuation =T

wordlengths= c(3,Inf)))

 

tokenize, removeNumbers, removePunctuation, wordsLengths와 제가 커스텀한 함수(words)가 인식이 안됩니다.

~are ignored 라는 경고가 뜨거나

예상하지 못한 기호(symbol)입니다 라는 에러가 뜹니다..

 

해결방법을 알고 계시는지요.

답변 1

답변을 작성해보세요.

0

안녕하세요 김승욱 입니다.

 

저도 텍스트마이닝을 하긴 합니다만 지금 상황만으로는 정확하게 판단하기 어렵습니다.

조금 더 정보가 필요한데 관련 코드나 샘플 데이터를 좀 더 제공해주시면 확인해드릴 수 있을 것 같습니다.

감사합니다.