인프런 커뮤니티 질문&답변

jms717958님의 프로필 이미지
jms717958

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링

3-4 민맥스스케일링에 대해 다시질문할게용 ㅠㅠ

해결된 질문

작성

·

193

0

  1. 강의에서 코딩하셨던 민맥스스케일링 코드에서 범주형 수치형데이터 분리없이 바로 X_train[cols]로 써도되나요? )

2,. 코딩 옆에 n_train[cols]=scaler.fit_transform[cols] 라고 적혀있었는데 여기서 왼쪽의 n_train[cols]를 n_train으로 바꿔적어도될까요? 안되면 그 이유가 궁금합니다

 

답변 2

1

LabelEncoder도 혹시 수치형, 범주형 안나누고 그냥 사용해도 되나요?

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 분리하지 않고 진행하면 됩니다.

시험이 어려워질 경우를 대비해 분리하는 방법을 처음부터 알려드렸는데

작업형2는 난이도가 유지되고 있어 아무런 문제가 없을 것 같아요!

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

당장 내일이 7회 시험이니 결론만 내려드리겠습니다.

수치형과 범주형 데이터를 나누지 말고 한번에 처리하는 방향으로 진행해주세요!

예시 코드는 아래와 같습니다.

from sklearn.preprocessing import MinMaxScaler
import pandas as pd

# 임시 데이터셋 생성
data_train = {
    'Age': [25, 35, 45, 55],
    'Salary': [40000, 50000, 60000, 80000]
}
data_test = {
    'Age': [30, 40, 50, 60],
    'Salary': [45000, 55000, 65000, 85000]
}
df_train = pd.DataFrame(data_train)
df_test = pd.DataFrame(data_test)


# MinMaxScaler 
scaler = MinMaxScaler()
# 스케일링을 적용할 컬럼 선택
cols = ['Age', 'Salary']


# Train 데이터셋에 fit_transform 적용
df_train[cols] = scaler.fit_transform(df_train[cols])
# Test 데이터셋에 transform 적용
df_test[cols] = scaler.transform(df_test[cols])

# 결과 출력
print("Train Data:")
print(df_train)
print("\nTest Data:")
print(df_test)
jms717958님의 프로필 이미지
jms717958

작성한 질문수

질문하기