inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 무료 강의 (활용편7) - 머신러닝

K-평균 (실습 #2)

K-평균(실습#2) 의 fit, fit_transform 질문입니다.

421

따숩게

작성한 질문수 5

0

StandardScaler()

KMeans()

객체 생성 후 fit_transform(), fit() 으로 학습데이터 만들기 하는데, 모두 훈련데이터니까...

둘다 fit(), 또는 fit_transform()으로 구분없이 사용해도 되는건가요?

아니면... 구분지어야 하는 이유가 있는건지 궁금합니다.

 

python 머신러닝 anaconda scikit-learn

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.
따숩게님, 질문 주셔서 감사합니다.

StandardScaler()KMeans()와 같은 사이킷런 라이브러리에서 제공하는 메서드를 사용할 때 fitfit_transform의 차이를 이해하는 것이 중요합니다.

fit 메서드는 데이터에 대한 학습만을 수행합니다. 즉, 데이터를 바탕으로 필요한 통계치(예를 들어, 평균과 표준편차 등)를 계산하고 모델을 학습시키는데 사용됩니다.
fit_transform 메서드는 학습을 수행하는 동시에, 학습된 파라미터로 데이터를 변환하는 작업도 거칩니다. 예를 들어, StandardScaler의 경우 학습 데이터를 표준화하는 과정으로, 각 특성의 평균을 0, 표준편차를 1로 만드는 변환을 수행합니다.

KMeans 알고리즘의 경우,
- fit은 클러스터 중심을 계산하고 데이터를 클러스터에 할당하는 과정을 거칩니다.
- fit_transformfit을 수행하고, 추가로 각 데이터 포인트를 클러스터 중심으로부터의 거리로 변환하는 과정을 포함합니다.

따라서 fitfit_transform을 사용할 때에는, 만약 변환된 데이터를 바로 사용하고 싶다면 fit_transform을, 단순히 모델을 학습시키기만 하고 싶다면 fit을 사용하면 됩니다. 다만, fit_transform은 일반적으로 학습 데이터에만 적용하고, 테스트 데이터는 따로 transform 메서드를 통해 변환하는 것이 일반적입니다. 이는 데이터의 정보 누설을 막고 모델의 일반화 능력을 평가하는 데 도움이 되기 때문입니다.

질문에 대한 답이 되었길 바라며, 더 궁금한 점이 있으시면 언제든지 문의해주시기 바랍니다.

import torch가 안되는 경우는 어떻게 하나요?

0

6

1

작업형 1 (삭제예정, 구 버전)

0

16

1

강의노트는 어디있나요?

0

9

0

노션 학습 자료 권한 요청

0

10

1

수강기간 연장 문의드립니다.

0

13

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

16

3

part2강의 문의사항입니다.

0

14

2

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

24

2

코드를 첨부해야하는 이유가 있나요?

0

19

2

소리가 겹쳐서 들려요

0

17

2

데스크톱과 노트북 연결

0

24

1

dict, zip

0

21

2

노션 : 파트3번 링크와 권한 , 파트4번 권한요청, 파트 5번도 미리 요청 드립니다.

0

27

4

6-6 실습 문의

0

21

2

미션 06-02

0

21

2

yes24 수집 md 파일 만들 때

0

20

2

python main.py 실행시 게임이 실행이 안돼요

0

21

2

antigravity 대신 cursor를 활용해도 되나요?

0

25

1

머신러닝 - surprise 모듈 설치 오류

0

354

1

K-평균(실습#3) 결과 값이 왜 다르게 나올까요?

0

234

1

다항회귀(실습#2)

0

269

1

선형 회귀

0

398

0

협업(리뷰 기반)필터링#1 질문

0

898

1