작성
·
11
0
안녕하세요,
작업형 2에서 train과 test 비교를 위해 set 함수를 통해 범주형변수의 카테고리가 같은지 비교를 합니다.
그 후에,
만약 여러개의 범주형 변수 중 단 하나의 컬럼이라도 train과 test가 다르다면 train과 test 데이터프레임을 concat으로 합쳐서 인코딩을 해야하는 것일까요?
train과 test 데이터셋을 합친 후 인코딩을 할때, 제가 원하는 특정 컬럼만을 정한 후 어떤 컬럼은 라벨, 어떤 컬럼은 원핫인코딩을 해도 괜찮을까요?
답변