-
카테고리
-
세부 분야
자격증 (데이터 사이언스)
-
해결 여부
해결됨
3-4 민맥스스케일링에 대해 다시질문할게용 ㅠㅠ
23.11.30 18:21 작성 조회수 117
0
강의에서 코딩하셨던 민맥스스케일링 코드에서 범주형 수치형데이터 분리없이 바로 X_train[cols]로 써도되나요? )
2,. 코딩 옆에 n_train[cols]=scaler.fit_transform[cols] 라고 적혀있었는데 여기서 왼쪽의 n_train[cols]를 n_train으로 바꿔적어도될까요? 안되면 그 이유가 궁금합니다
답변을 작성해보세요.
1
퇴근후딴짓
지식공유자2024.01.16
네 분리하지 않고 진행하면 됩니다.
시험이 어려워질 경우를 대비해 분리하는 방법을 처음부터 알려드렸는데
작업형2는 난이도가 유지되고 있어 아무런 문제가 없을 것 같아요!
0
퇴근후딴짓
지식공유자2023.12.01
당장 내일이 7회 시험이니 결론만 내려드리겠습니다.
수치형과 범주형 데이터를 나누지 말고 한번에 처리하는 방향으로 진행해주세요!
예시 코드는 아래와 같습니다.
from sklearn.preprocessing import MinMaxScaler
import pandas as pd
# 임시 데이터셋 생성
data_train = {
'Age': [25, 35, 45, 55],
'Salary': [40000, 50000, 60000, 80000]
}
data_test = {
'Age': [30, 40, 50, 60],
'Salary': [45000, 55000, 65000, 85000]
}
df_train = pd.DataFrame(data_train)
df_test = pd.DataFrame(data_test)
# MinMaxScaler
scaler = MinMaxScaler()
# 스케일링을 적용할 컬럼 선택
cols = ['Age', 'Salary']
# Train 데이터셋에 fit_transform 적용
df_train[cols] = scaler.fit_transform(df_train[cols])
# Test 데이터셋에 transform 적용
df_test[cols] = scaler.transform(df_test[cols])
# 결과 출력
print("Train Data:")
print(df_train)
print("\nTest Data:")
print(df_test)
답변 2