💰 포인트 기능 오픈 💰

kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.

미해결질문
dorddo 프로필

안녕하세요, 

강의 잘 들었습니다. 

현재는 필요한 부분을 다시 들으며 복습하고 있습니다. 

강의 중 kaggle의 titanic 문제에 대해 다루는 부분에 대해 질문드립니다. 

embarked의 경우엔 텍스트로 된 범주형 자료이기에  one-hot encoding으로 분류해주는 것으로 이해했습니다. 

하지만 강의에서는 pclass의 경우 구분해주지 않고 숫자 그대로 사용하고 있습니다. 

하지만 엄밀한 의미에서 pclass도 숫자이긴 하지만 fare와 같은 연속형 자료가 아닌 범주형 자료이기 때문에 

one-hot encoding으로 분류를 해주어야 하지 않은지 문의드립니다. 

만약 하지 않아도 괜찮다면, embarked도 01,2,3,으로 나누어서 작업해도 되지 않은지도 궁금합니다. 

+혹시 pclass가 범주형 자료이지만 계급이라는 특성상 하이에라키가 있어서 연속형의 성질을 가지고 있어서 one-hot encoding을 하지 않다고 되는 것인지도 문의드립니다. 

감사합니다. 

지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스