inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글(kaggle) 필사 전략

타이타닉 작업형2 오류 질문입니다.

해결된 질문

382

pjh990219

작성한 질문수 6

0

안녕하세요 강사님

타이타닉 작업형2 코드를 작성하던 중 발생한 오류는 아래와 같습니다.

즉, X_train 컬럼 수와 X_test 컬럼 수가 달라 발생한 문제라고 인지하였습니다.

 

이를 해결하기 위해 강사님 코드를 참고하여 다른 점은 원핫 인코딩 대상 컬럼에 차이가 있었습니다.

 

저는 원핫 인코딩을 아래와 같이 작성하였으나,'Ticket', 'Cabin', 'Embarked' 컬럼을 지우니 문제가 해결되었습니다.

'Ticket', 'Cabin', 'Embarked' 컬럼은 범주형 변수인데 원핫인코딩을 하지않고 넘어가는 이유와 위의 변수를 포함하여 원핫인코딩 했을 때 어떠한 이유로 오류가 발생하는지 질문드립니다..

 

매번 친절히 답변해주셔서 감사합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

7XX 와 2XX로 다른 것을 봐서는 test와 train 범주형 데이터가 많이 다른 것 같아요!
추가한 컬럼을 value_counts()로 확인해보시죠!!

 

train과 test 합쳐서 인코딩 진행하면 문제가 없습니다.

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

0

0

2유형 원핫인코딩 오류

0

11

2

시험장에서 주석 단축키 안될 때 많나요?

0

17

2

라벨인코딩 방식

0

17

2

test 재학습 관련

0

12

2

target 빈도 확인

0

14

2

작업형 2 연습문제 섹션 6

0

16

2

F1-score

0

16

2

작업형 2번 섹션 3

0

14

2

작업형 2 인코딩, 결측치, 모델 선택 질문

0

19

1

인코딩 방식 문의

0

24

2

9회 3유형 ==> 7회 3유형 질문드려요

0

13

2

작업형 2관련 질문입니다

0

13

2

작업형2 카테고리

0

23

2

110강 회귀_8번 문의

0

15

2

XGBRegressor 학습 시 warning 출력

0

21

2

데이터 프레임을 변경해도 되나요?

0

13

2

10회 기출 작업형3 문제 2-1 질문

0

20

2

작업형 2 질문

0

21

2

작업형 2 템플릿 확인 요청

0

24

2

작업형2 인코딩 질문

0

26

2

작업형 3 벼락치기 공부방법 질문

0

34

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

34

2

예측값 결과 소수점 차이

0

30

2