• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

질문있습니다.

23.05.25 22:07 작성 조회수 192

0

라벨 인코더 실행할 때나, 스케일러 실행할 때,

X_train 에서는 fit_transform 함수를 사용하고

X_test 에서는 transform 함수를 사용하는데,

무슨 차이가 있는지 궁금합니다.

답변 2

·

답변을 작성해보세요.

1

daeho4.kim님의 프로필

daeho4.kim

질문자

2023.05.26

이해하기 쉽게 설명해주셔서 감사드립니다! :)

1

X_train 에서 fit_transform 함수는

fit 과 transform 2개를 합쳐놓았어요

예를들어

fit은 train에 사과와 배 2개가 있는 것을 학습하고 사과는 0, 배는 1로 사전을 만들고

transform에서 문자를 숫자로 적용합니다(라벨인코딩)

train과 동일하게 test도 적용하기 위해 test는 transform만 적용해요 😆

허민영님의 프로필

허민영

2023.10.15

스케일링/인코딩 과정에서 데이터를 학습시킨다는 게 어떤 의미가 있을까요?

모델을 만들어 학습시키는 것과는 다른 개념인가요?

민영님,
1. 네 다른 개념입니다. 모델학습은 별개입니다.
2. 스케일링/인코딩 중 인코딩을 예를들어 설명하면
train을 fit할 때 사전을 만들어요. 딸기->1, 사과->2, 배->3
그리고 transform으로 train데이터에 배, 배, 사과, 딸기가 있다면 3,3,2,1로 변경하는거죠
그걸 fit_transform으로 한번에 수행한답니다.

test는 새롭게 fit하는 것이 아니라 train에서 만든 사전을 활용해 transform만 적용하는거죠!

허민영님의 프로필

허민영

2023.10.15

상세하고 빠른 답변 감사드립니다!! 학습에 많은 도움이 됩니다. 12월 시험 꼭 합격하겠습니다.