train, test 범주형 컬럼의 고유값이 같은지 확인하는 코딩은 없나요
132
작성한 질문수 8
19개 종류를 다 비교 하기 쉽지 않습니다.
그리고 만약 train에 없는 고유값이 test에서 있으면 데이터를 합친다고 했는데, 범주형을 합쳐서 인코딩 한 다음에 다시 분리 할때는 loc, iloc 사용하나요? 그래서 처음 shape의 데이터 크기로 똑같이 맞춰야 하는거죠?
예를 들면 train.shape (6118,10) test.shape (1724,9) 라면 처음에 concat를 통해 6118+1724 로 해서 범주형 인코딩 하고 다시 원래 대로 크기를 쪼개야 하는거죠?
답변 2
0
네 컬럼개수만 맞춰주면 되고영 그래서 iloc하면서 길이 헷갈리거나 하지 않게 아예 이렇게 쓰면 좋은걸로 알고있어요
X_train_processed = X_traintest_concat[:len(X_train_original)]
X_test_processed = X_traintest_concat[len(X_train_original):]
작업형 1 유형 부분
0
9
1
작업형 1 (삭제예정, 구 버전)
0
28
2
수강기간 연장 문의드립니다.
0
20
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
20
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
26
2
질문 드립니다.
0
45
2
강의 내용 관련 질문드립니다~
0
43
2
수강 연장 문의
0
54
2
강의자료 일괄 다운로드
0
49
2
수강기간 연장 문의드립니다
0
40
2
list 문제 질문드립니다~
0
34
2
빅분기 실기 12회 재도전
0
52
2
강의 기간 연장 가능여부 검토 요청건
0
38
2
수강기간 연장 문의 드립니다
0
43
2
수강기간 연장 문의드립니다
0
50
2
질문이요
0
55
2
수강기간 연장 문의드립니다.
0
58
2
문제 3-2 질문드립니다
0
47
2
수강기간 연장 문의 드립니다.
0
61
2
변수, 칼럼 , df 구분
0
51
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
49
2
수강기간 연장 문의드립니다.
0
42
2






