해결된 질문
작성
·
193
답변 2
1
0
당장 내일이 7회 시험이니 결론만 내려드리겠습니다.
수치형과 범주형 데이터를 나누지 말고 한번에 처리하는 방향으로 진행해주세요!
예시 코드는 아래와 같습니다.
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
# 임시 데이터셋 생성
data_train = {
'Age': [25, 35, 45, 55],
'Salary': [40000, 50000, 60000, 80000]
}
data_test = {
'Age': [30, 40, 50, 60],
'Salary': [45000, 55000, 65000, 85000]
}
df_train = pd.DataFrame(data_train)
df_test = pd.DataFrame(data_test)
# MinMaxScaler
scaler = MinMaxScaler()
# 스케일링을 적용할 컬럼 선택
cols = ['Age', 'Salary']
# Train 데이터셋에 fit_transform 적용
df_train[cols] = scaler.fit_transform(df_train[cols])
# Test 데이터셋에 transform 적용
df_test[cols] = scaler.transform(df_test[cols])
# 결과 출력
print("Train Data:")
print(df_train)
print("\nTest Data:")
print(df_test)
네 분리하지 않고 진행하면 됩니다.
시험이 어려워질 경우를 대비해 분리하는 방법을 처음부터 알려드렸는데
작업형2는 난이도가 유지되고 있어 아무런 문제가 없을 것 같아요!