kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.
160
작성한 질문수 2
안녕하세요,
강의 잘 들었습니다.
현재는 필요한 부분을 다시 들으며 복습하고 있습니다.
강의 중 kaggle의 titanic 문제에 대해 다루는 부분에 대해 질문드립니다.
embarked의 경우엔 텍스트로 된 범주형 자료이기에 one-hot encoding으로 분류해주는 것으로 이해했습니다.
하지만 강의에서는 pclass의 경우 구분해주지 않고 숫자 그대로 사용하고 있습니다.
하지만 엄밀한 의미에서 pclass도 숫자이긴 하지만 fare와 같은 연속형 자료가 아닌 범주형 자료이기 때문에
one-hot encoding으로 분류를 해주어야 하지 않은지 문의드립니다.
만약 하지 않아도 괜찮다면, embarked도 01,2,3,으로 나누어서 작업해도 되지 않은지도 궁금합니다.
+혹시 pclass가 범주형 자료이지만 계급이라는 특성상 하이에라키가 있어서 연속형의 성질을 가지고 있어서 one-hot encoding을 하지 않다고 되는 것인지도 문의드립니다.
감사합니다.
답변 0
environment setup - windows 사용자는 어떻게
0
214
0
Chapter 10에 대한 강의안이 없는것 같습니다.
0
287
0
이게 이렇게 어려운 이유가 뭐죠?
0
231
0
Python 코드 실행을 위한 코드 다운로드 관련
0
252
1
matrix product문제 질문 드립니다.
0
222
0
강의자료중 코드는 다운로드 안 되나요?
0
191
0
scikit-learn preprocessing 할때 Data Frame object has no attribute 'as matrix'라는 오류가 뜹니다
0
351
1
pdf 강의자료 다운로드 관련
0
214
1
과제 제출 시 위 에러가 나옵니다. 어떻게 해야 하나요?
0
228
1
Gradient Boosting에서 Light GBM, XGBOOST
0
331
1
np.where 값 리턴
0
304
1
숙제 제출 오류
0
218
1
다른분들이 짠 코드를 볼수있을까요?
0
204
1
house data 전처리 코드 관련 질문
0
683
1
설치이후 Pandas import 문제
0
1629
2
import sklearn import preprocessing 부터 에러가 납니다.
0
389
2
엑셀 파일 생성이 안됩니다.
0
488
2
딥러닝 강좌 관련해서 질문올립니다.
0
213
1
ch11 강의 코드
0
216
0
코드를 볼수 가 없어요
0
272
0
소스코드
0
170
1
질문있습니다
0
148
1
deactivate 가 되지 않는 경우
0
253
1
소스 위치는?
0
171
1





