inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

실전 데이터 사이언스 Part2. 데이터 전처리

로그 변환

로그변환에 대하여

630

피카라이언

작성한 질문수 7

0

안녕하세요.

로그변환에 대하여 궁금한게 있어 질문 남겨봅니다.

로그 변환을 한 데이터들이 모델이 학습해서 예측하기 좋아서 변환 시켜주는건가요? 로그변환을 안한 데이터를 학습하는거랑 accuracy/precision/f1 score등 차이가 나는지 궁금합니다.

또한 입력특성의 로그변환은 왜 하는지 궁금합니다. 다른 variable들은 로그변환 고려를 안하는건가요? (지하실면적 제외). 아니면 Trial and error을 통해 로그변환 하나씩 시켜보는게 더 효과적인건가요? 

로그변화 python 데이터분석

답변 1

1

김화종

안녕하세요.

어떤 변수들은 로그변환한 값을 사용해야 성능이 좋아집니다. (분류 및 예측 모두).

로그변환의 대상이 되는 데이터는 금전에 관한 것, 생물학적 반응에 관한 것 등입니다. 귀로듣는 사운드의 경우도 로그변환이 필요합니다.

로그변환을 하는 이유는 입력과 출력의 관계가 선형적이 되서 "설명"을 더 잘 할 수 있기 때문입니다.

지하실 면적처럼 면적이 크다고 면적에 비례해서 집 값이 올라가는 것이 아니라 큰 값을 약화시키는 것이 더 모델의 성능을 개선시키는 사례도 있습니다. 이러한 사례는 경험과 시행착오로 찾는 것입니다. (데이터의 확률 분포를 보고 가능한 정규 분포 모양을 따르는지 보고 관찰합니다..

질문 드립니다.

0

24

2

노션 링크

0

23

3

26년 1회 실기 해설 강의

0

28

2

노션 권한요청하였습니다 언제쯤 볼수있나요

0

27

2

AAFM CWM_LEVEL_2 Exam Questions 2026: Right Preparation Method

0

19

1

강의 내용 관련 질문드립니다~

0

26

2

퍼플렉시티 최소 결제단위 50달러로 바뀐 것 같습니다.

0

28

2

수강 연장 문의

0

23

1

강의자료 일괄 다운로드

0

29

2

5번 강의 1분까지 완료 후 오류가 뜹니다

0

22

2

list 문제 질문드립니다~

0

23

2

for, range 추가 방법

0

25

0

빅분기 실기 12회 재도전

0

36

1

노션 접속 권한 요청드립니다.

0

23

2

강의 기간 연장 가능여부 검토 요청건

0

26

1

수강기간 연장 문의 드립니다

0

32

2

결측값 처리

0

559

1

n_step 값에 대하여

0

440

1

dir*.csv가 안됩니다.

0

312

1

6 시그마 이상 outlier

0

544

1

In[42] 14:50 코드 질문

0

240

1

Titanic 데이터셋 PClass cateogrical -> one hot encoding

0

375

1

표준 스케일링관련 문의

0

302

1

6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문

0

733

1