24.01.19 11:25 작성
·
191
0
안녕하세요
저는 선생님 강의도 듣고, 블로그도 보면서 보통명사 추출하는 함수를 생성해서 tm패키지를 활용해 코퍼스로 변환하는 내용을 공부하고 있습니다~
커스텀함수는 이렇게 입력하고
words<-function(text){
text<- as.character(text)
extractNoun(text)
이후 변환을 하려고 하는데
doc<- TermDocumentMatrix(doc,
control = list(
tokenize= words
removeNumbers =T
removePunctuation =T
wordlengths= c(3,Inf)))
tokenize, removeNumbers, removePunctuation, wordsLengths와 제가 커스텀한 함수(words)가 인식이 안됩니다.
~are ignored 라는 경고가 뜨거나
예상하지 못한 기호(symbol)입니다 라는 에러가 뜹니다..
해결방법을 알고 계시는지요.
답변 1
0
2024. 01. 19. 14:25
안녕하세요 김승욱 입니다.
저도 텍스트마이닝을 하긴 합니다만 지금 상황만으로는 정확하게 판단하기 어렵습니다.
조금 더 정보가 필요한데 관련 코드나 샘플 데이터를 좀 더 제공해주시면 확인해드릴 수 있을 것 같습니다.
감사합니다.