강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của kyb0008066050
kyb0008066050

câu hỏi đã được viết

Phương pháp phân tích Big Data/Text Mining (LDA, BERTtopic, phân tích cảm xúc, CONCOR với ChatGPT)

Kỹ thuật tiền xử lý dữ liệu cho kết quả mong muốn

원하는 결과를 얻기위한 데이터 전처리 기법

Đã giải quyết

Viết

·

301

0


여기서 "하는"은 하다로 바꾸시고 "있는"은 있다로 바꾸시지 않았으셨는데, 이유가 있을까요?
얻고자 하는 데이터 값에 따라 단어를 바꿀 수도 있고 삭제할 수도 있지만 보편적으로 좋은 값을 얻기 위한 삭제 또는 변경 기준이 있을까요?

빅데이터텍스트마이닝

Câu trả lời 1

0

HappyAI님의 프로필 이미지
HappyAI
Người chia sẻ kiến thức

제가 강의에서 예시로 했기 때문인데요.

 

기준의 경우 연구목적과 관련 없는 단어를 수정하거나 삭제한다고 보시면 되는ㄷ요.

 

일반적으로 지금과 같이 동사를 기본형으로 바꾸어주거나 과거형,미래형을 현재형으로 바꾸어주는것, 그리고 잘린단어를 수정하는 작업등이 이루어지구요. 삭제 시에는 의미없는 단어, 의미없는 숫자 등이 제거됩니다.

 

 

Hình ảnh hồ sơ của kyb0008066050
kyb0008066050

câu hỏi đã được viết

Đặt câu hỏi