• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

스케일링 질문드립니다.

23.12.01 11:17 작성 조회수 82

0

n_train = train.select_dtypes(exclude='object').copy()

n_test = train.select_dtypes(exclude='object').copy()

보통 민맥스 스케일링 할 때 위처럼 오브젝트와 아닌 것들을 나눈 뒤에 아래 처럼 스케일링을 진행하잖아요.

 

근데 밑에서 cols 변수에 수치형 데이터만 명시를 하는데

굳이 나눠서 하는 이유가 뭔가요??

그냥 train[cols] 로 해도 전혀 문제 없는 거 아닌가요?

 

cols = ['컬럼명', '컬럼명', '컬럼명']

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

n_train[cols] = scaler.fit_trainsform(n_train[cols])

n_test[cols] = scaler.trainsform(n_test[cols])

답변 1

답변을 작성해보세요.

0

네 나눠서 하지 않아도 됩니다.

아래처럼 진행해주세요 🙂

 

시험 잘 보고 오세요!!