강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

pang 5님의 프로필 이미지
pang 5

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런으로 수행하는 타이타닉 생존자 예측 - 02

안녕하세요 label encoding 질문드립니다

작성

·

314

0

레이블 인코딩 설명 중에 숫자 끼리의 크기가 영향을 줄 수도 있어서 모델링 시 원하는 결과가 나오지 않을 수 있어 이를 해결하고자 원 핫 인코딩을 사용한다고 햇는데 타이타닉 예제에서는 그대로 사용해도 영향을 안받는건가요? 아니면 원핫인코딩시 생성되는 변수가 너무 많아져서 그런건가요? 궁금합니다

퀴즈

머신러닝에서 예측 모델 학습에 사용되는 입력 데이터를 일반적으로 무엇이라고 부를까요?

레이블

특성 (Feature)

타겟 값

클래스

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

원핫 인코딩을 만든 이유는 말씀하신게 맞습니다. 다만 원핫 인코딩을 적용한다고 무조건 성능이 높아 지는 것 아닙니다. 데이터 별로 좋아질 수도 있고, 별 효과가 없을 수도 있습니다. 타이타닉예제에서는 원핫 인코딩에 수강생 분들이 아직 익숙하지 않을 것 같아서 적용하지 않았을 뿐입니다. 충분히 적용해도 무방합니다. 

감사합니다. 

pang 5님의 프로필 이미지
pang 5

작성한 질문수

질문하기