inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

train, test 범주형 컬럼의 고유값이 같은지 확인하는 코딩은 없나요

138

jcol13

작성한 질문수 8

0

19개 종류를 다 비교 하기 쉽지 않습니다.

그리고 만약 train에 없는 고유값이 test에서 있으면 데이터를 합친다고 했는데, 범주형을 합쳐서 인코딩 한 다음에 다시 분리 할때는 loc, iloc 사용하나요? 그래서 처음 shape의 데이터 크기로 똑같이 맞춰야 하는거죠?

예를 들면 train.shape (6118,10) test.shape (1724,9) 라면 처음에 concat를 통해 6118+1724 로 해서 범주형 인코딩 하고 다시 원래 대로 크기를 쪼개야 하는거죠?

 

image.png

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

이주희

네 컬럼개수만 맞춰주면 되고영 그래서 iloc하면서 길이 헷갈리거나 하지 않게 아예 이렇게 쓰면 좋은걸로 알고있어요

X_train_processed = X_traintest_concat[:len(X_train_original)]
X_test_processed = X_traintest_concat[len(X_train_original):]

0

퇴근후딴짓

  1. 새소식에 올린 글을 확인해 주세요

    image.png

    설명이 되어 있습니다 🙂

 

작업형2 카테고리

0

8

1

110강 회귀_8번 문의

0

9

2

XGBRegressor 학습 시 warning 출력

0

13

2

데이터 프레임을 변경해도 되나요?

0

10

2

10회 기출 작업형3 문제 2-1 질문

0

16

2

작업형 2 질문

0

16

2

작업형 2 템플릿 확인 요청

0

13

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

31

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

32

2

예측값 결과 소수점 차이

0

28

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

35

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

33

2

옳게 풀은건지 질문드립니다!

0

22

1

roc_auc_score

0

30

2

추가질문 합니다

0

22

2

시험환경 구름

0

21

2

2유형 질문드려요

0

21

2

RandomForest vs lgb

0

30

2

전처리 관련질문

0

29

3

작업형3 기출

0

21

2

유형2에서 데이터분할 생략 가능여부

0

33

2

9회 기출 유형3 질문

0

21

2