작성
·
32
·
수정됨
0
안녕하세요~ 기출문제 강의 영상을 보면 작업형 2에서 범주형 데이터는 인코딩을 하고, 수치형 데이터는 따로 정규화 작업을 수행하지 않는 경우가 있습니다. 수치형 데이터의 경우 정규화를 안해도 결과값에 큰 영향을 주지는 않나요?
수치형데이터를 정규화 하는 경우 아래의 방법이 맞는지도 질문드립니다. 감사합니다.
#수치형, 범주형 구분
n_train = train.select_dtypes(exclude='object')
n_test = test.select_dtypes(exclude='object')
c_train = train.select_dtypes(include='object')
c_test = test.select_dtypes(include='object')
# 수치형데이터 정규화
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
cols = train.select_dtypes(exclude='object').columns
n_train[cols] = scaler.fit_transform(n_train[cols])
n_test[cols] = scaler.transform(n_test[cols])
# 합치기
train = pd.concat([n_train, c_train], axis=1)
test = pd.concat([n_test, c_test], axis=1)
답변