캐글 개 나이 예측 문항
안녕하세요!
작업형 2번 관련해서 질문 드려도 괜찮을까요…?
혹시 get dummies 하기 전에 데이터 합치고 나눠야만 하나요..?
수치형 데이터로 구성되어있고, 컬럼 같을 경우에는 합치고 나누는 작업 없이 get dummies 진행했는데 다른 풀이하고 결과값이 조금 차이 나는 것 같아서요!
Get dummies 전후로 데이터 합치고 나누는 이유를 알고 싶습니다!
제 코드
# print(train.shape, test.shape)
train = pd.get_dummies(train)
test = pd.get_dummies(test)
# print(train.shape, test.shape)
다른 분들 모범 코드입니다¡
data = pd.concat([train,test])
data = pd.get_dummies(data)
train = data.iloc[:len(train)]
test = data.iloc[len(train):]
답변 1
0
아마도 카테고리가 다를 경우를 대비해 합쳐서 인코딩하는 것으로 무조건 준비하는 분들이 계세요~
그 경우인 것 같습니다 🙂
꿀팁 "인코딩 할 때 에러가 난다면?" 영상참고
질문 드립니다.
0
38
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
33
1
강의자료 일괄 다운로드
0
42
2
수강기간 연장 문의드립니다
0
28
1
list 문제 질문드립니다~
0
30
2
빅분기 실기 12회 재도전
0
40
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
47
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
50
2
문제 3-2 질문드립니다
0
44
2
수강기간 연장 문의 드립니다.
0
58
2
변수, 칼럼 , df 구분
0
50
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
48
2
수강기간 연장 문의드립니다.
0
42
2
수강기한 연장 문의
0
79
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
45
2
수강기간 연장 문의드립니다.
0
71
2
수강연장 문의
0
77
2
수강연장문의
0
53
2





