• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

3-4 민맥스스케일링에 대해 다시질문할게용 ㅠㅠ

23.11.30 18:21 작성 조회수 117

0

  1. 강의에서 코딩하셨던 민맥스스케일링 코드에서 범주형 수치형데이터 분리없이 바로 X_train[cols]로 써도되나요? )

2,. 코딩 옆에 n_train[cols]=scaler.fit_transform[cols] 라고 적혀있었는데 여기서 왼쪽의 n_train[cols]를 n_train으로 바꿔적어도될까요? 안되면 그 이유가 궁금합니다

 

답변 2

·

답변을 작성해보세요.

1

LabelEncoder도 혹시 수치형, 범주형 안나누고 그냥 사용해도 되나요?

네 분리하지 않고 진행하면 됩니다.

시험이 어려워질 경우를 대비해 분리하는 방법을 처음부터 알려드렸는데

작업형2는 난이도가 유지되고 있어 아무런 문제가 없을 것 같아요!

0

당장 내일이 7회 시험이니 결론만 내려드리겠습니다.

수치형과 범주형 데이터를 나누지 말고 한번에 처리하는 방향으로 진행해주세요!

예시 코드는 아래와 같습니다.

from sklearn.preprocessing import MinMaxScaler
import pandas as pd

# 임시 데이터셋 생성
data_train = {
    'Age': [25, 35, 45, 55],
    'Salary': [40000, 50000, 60000, 80000]
}
data_test = {
    'Age': [30, 40, 50, 60],
    'Salary': [45000, 55000, 65000, 85000]
}
df_train = pd.DataFrame(data_train)
df_test = pd.DataFrame(data_test)


# MinMaxScaler 
scaler = MinMaxScaler()
# 스케일링을 적용할 컬럼 선택
cols = ['Age', 'Salary']


# Train 데이터셋에 fit_transform 적용
df_train[cols] = scaler.fit_transform(df_train[cols])
# Test 데이터셋에 transform 적용
df_test[cols] = scaler.transform(df_test[cols])

# 결과 출력
print("Train Data:")
print(df_train)
print("\nTest Data:")
print(df_test)