강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

tyals2님의 프로필 이미지
tyals2

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

3회 기출문제(작업형2) 스케일링 질문드립니다.

해결된 질문

작성

·

30

·

수정됨

0

안녕하세요 강사님! 좋은 강의에 감사드립니다.

다름이 아니라, 3회 기출문제(작업형2)에서

아래와 같이 robust scaler를 사용하실 때

train과 test를 각각 스케일링하는 거랑

data = pd.concat[train, test]로 합치는 것과 실전에서 영향이 없을까요?

train 범위 표본을 가지고 fit 한 경우와 concat한 큰 data를 가지고 fit 한 경우가 스케일링 결과가 다른 경우가 있을까요?

 

n_train[cols] = scaler.fit_transform(n_train[cols])
n_test[cols] = scaler.transform(n_test[cols])

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

랜덤포레스트 모델, lightgbm과 같은 트리계열의 모델을 사용한다면

스케일 자체가 영향이 크지 않아요!

 

합쳐서 하는 방법은 정석은 아니어서

train 범위 표본을 가지고 하는 것이 일반적입니다.

test는 실무에서는 새로운 데이터라 당장은 알 수 없는 영역이거든요

tyals2님의 프로필 이미지
tyals2

작성한 질문수

질문하기