작성한 질문수
빅데이터/텍스트마이닝 논문 작성법(LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
원하는 결과를 얻기위한 데이터 전처리 기법
해결된 질문
작성
·
181
0
여기서 "하는"은 하다로 바꾸시고 "있는"은 있다로 바꾸시지 않았으셨는데, 이유가 있을까요? 얻고자 하는 데이터 값에 따라 단어를 바꿀 수도 있고 삭제할 수도 있지만 보편적으로 좋은 값을 얻기 위한 삭제 또는 변경 기준이 있을까요?
답변 1
제가 강의에서 예시로 했기 때문인데요.
기준의 경우 연구목적과 관련 없는 단어를 수정하거나 삭제한다고 보시면 되는ㄷ요.
일반적으로 지금과 같이 동사를 기본형으로 바꾸어주거나 과거형,미래형을 현재형으로 바꾸어주는것, 그리고 잘린단어를 수정하는 작업등이 이루어지구요. 삭제 시에는 의미없는 단어, 의미없는 숫자 등이 제거됩니다.