강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

pang 5님의 프로필 이미지
pang 5

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런으로 수행하는 타이타닉 생존자 예측 - 02

안녕하세요 label encoding 질문드립니다

작성

·

314

0

레이블 인코딩 설명 중에 숫자 끼리의 크기가 영향을 줄 수도 있어서 모델링 시 원하는 결과가 나오지 않을 수 있어 이를 해결하고자 원 핫 인코딩을 사용한다고 햇는데 타이타닉 예제에서는 그대로 사용해도 영향을 안받는건가요? 아니면 원핫인코딩시 생성되는 변수가 너무 많아져서 그런건가요? 궁금합니다

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

원핫 인코딩을 만든 이유는 말씀하신게 맞습니다. 다만 원핫 인코딩을 적용한다고 무조건 성능이 높아 지는 것 아닙니다. 데이터 별로 좋아질 수도 있고, 별 효과가 없을 수도 있습니다. 타이타닉예제에서는 원핫 인코딩에 수강생 분들이 아직 익숙하지 않을 것 같아서 적용하지 않았을 뿐입니다. 충분히 적용해도 무방합니다. 

감사합니다. 

pang 5님의 프로필 이미지
pang 5

작성한 질문수

질문하기