밑바닥 부터 시작하는 머신러닝 입문

kaggle_titanic_pclass one-hot encoding에 대해 질문드립니다.

2019-09-25T06:11:15.858Z

166

dorddo

작성한 질문수 2

안녕하세요,

강의 잘 들었습니다.

현재는 필요한 부분을 다시 들으며 복습하고 있습니다.

강의 중 kaggle의 titanic 문제에 대해 다루는 부분에 대해 질문드립니다.

embarked의 경우엔 텍스트로 된 범주형 자료이기에 one-hot encoding으로 분류해주는 것으로 이해했습니다.

하지만 강의에서는 pclass의 경우 구분해주지 않고 숫자 그대로 사용하고 있습니다.

하지만 엄밀한 의미에서 pclass도 숫자이긴 하지만 fare와 같은 연속형 자료가 아닌 범주형 자료이기 때문에

one-hot encoding으로 분류를 해주어야 하지 않은지 문의드립니다.

만약 하지 않아도 괜찮다면, embarked도 01,2,3,으로 나누어서 작업해도 되지 않은지도 궁금합니다.

+혹시 pclass가 범주형 자료이지만 계급이라는 특성상 하이에라키가 있어서 연속형의 성질을 가지고 있어서 one-hot encoding을 하지 않다고 되는 것인지도 문의드립니다.

감사합니다.

머신러닝 배워볼래요?

답변 0

environment setup - windows 사용자는 어떻게

2021-11-16T02:50:58.126Z

220

Chapter 10에 대한 강의안이 없는것 같습니다.

2021-08-06T12:20:12.292Z

291

이게 이렇게 어려운 이유가 뭐죠?

2021-07-02T13:51:37.864Z

242

Python 코드 실행을 위한 코드 다운로드 관련

2021-02-21T09:04:24.531Z

272

matrix product문제 질문 드립니다.

2020-11-14T03:30:31.722Z

230

강의자료중 코드는 다운로드 안 되나요?

2020-05-07T20:19:23.073Z

205

scikit-learn preprocessing 할때 Data Frame object has no attribute 'as matrix'라는 오류가 뜹니다

2020-04-07T15:06:53.337Z

369

pdf 강의자료 다운로드 관련

2020-04-07T03:44:31.488Z

228

과제 제출 시 위 에러가 나옵니다. 어떻게 해야 하나요?

2020-04-06T22:33:19.939Z

242

Gradient Boosting에서 Light GBM, XGBOOST

2020-03-24T11:41:12.139Z

352

np.where 값 리턴

2020-03-21T07:04:10.134Z

329

숙제 제출 오류

2020-03-09T08:52:09.001Z

226

다른분들이 짠 코드를 볼수있을까요?

2020-03-08T08:01:13.272Z

221

house data 전처리 코드 관련 질문

2020-03-06T10:11:07.220Z

694

설치이후 Pandas import 문제

2020-02-25T14:00:59.608Z

1652

import sklearn import preprocessing 부터 에러가 납니다.

2019-12-29T13:35:02.979Z

411

엑셀 파일 생성이 안됩니다.

2019-12-17T23:03:05.597Z

514

딥러닝 강좌 관련해서 질문올립니다.

2019-11-06T01:18:35.700Z

231

ch11 강의 코드

2019-10-15T14:55:15.537Z

227

코드를 볼수 가 없어요

2019-10-15T14:47:08.259Z

281

소스코드

2019-10-11T10:00:13.858Z

179

질문있습니다

2019-10-04T02:27:54.956Z

158

deactivate 가 되지 않는 경우

2019-10-03T05:41:56.768Z

264

소스 위치는?

2019-09-19T03:59:08.555Z

187