강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của donggeunko2496
donggeunko2496

câu hỏi đã được viết

Khoa học dữ liệu thực tế Phần 2. Tiền xử lý dữ liệu

Biến đổi log

로그변환에 대하여

Viết

·

616

0

안녕하세요.

로그변환에 대하여 궁금한게 있어 질문 남겨봅니다.

로그 변환을 한 데이터들이 모델이 학습해서 예측하기 좋아서 변환 시켜주는건가요? 로그변환을 안한 데이터를 학습하는거랑 accuracy/precision/f1 score등 차이가 나는지 궁금합니다.

또한 입력특성의 로그변환은 왜 하는지 궁금합니다. 다른 variable들은 로그변환 고려를 안하는건가요? (지하실면적 제외). 아니면 Trial and error을 통해 로그변환 하나씩 시켜보는게 더 효과적인건가요? 

로그변화python데이터분석

Câu trả lời 1

1

hjkim3님의 프로필 이미지
hjkim3
Người chia sẻ kiến thức

안녕하세요.

어떤 변수들은 로그변환한 값을 사용해야 성능이 좋아집니다. (분류 및 예측 모두).

로그변환의 대상이 되는 데이터는 금전에 관한 것, 생물학적 반응에 관한 것 등입니다. 귀로듣는 사운드의 경우도 로그변환이 필요합니다.

로그변환을 하는 이유는 입력과 출력의 관계가 선형적이 되서 "설명"을 더 잘 할 수 있기 때문입니다.

지하실 면적처럼 면적이 크다고 면적에 비례해서 집 값이 올라가는 것이 아니라 큰 값을 약화시키는 것이 더 모델의 성능을 개선시키는 사례도 있습니다. 이러한 사례는 경험과 시행착오로 찾는 것입니다. (데이터의 확률 분포를 보고 가능한 정규 분포 모양을 따르는지 보고 관찰합니다..

Hình ảnh hồ sơ của donggeunko2496
donggeunko2496

câu hỏi đã được viết

Đặt câu hỏi