강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

zas6581님의 프로필 이미지
zas6581

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

분류 실습 2: 신용카드 사기 예측 실습 - 01

데이터 정규분포

작성

·

235

0

데이터를 정규분포 가깝게 변환시켜주는 이유가 궁금합니다.

데이터의 feature마다 단위가 달라서 그런건가요?

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

데이터를 정규분포 형태로 반드시 변환할 필요는 없습니다.

정규 분포형태로 변환하지 않는다고 성능이 많이 저하되지는 않습니다만,  할 수 있으면 해주는게 좋습니다.

머신러닝을 이루는 기반 알고리즘이 데이터가 정규 분포 형태를 가지고 있다고 가정하고 만들어진 경우들이 있습니다. Logistic Regression과 같이 선형 계열 알고리즘이 조금 영향을 받을 수 있습니다.

데이터의 feature 단위가 다를 때도 z변환 형태의 정규 분포  변환을 해줄 수도 있습니다.

감사합니다.

zas6581님의 프로필 이미지
zas6581

작성한 질문수

질문하기