K-평균(실습#2) 의 fit, fit_transform 질문입니다.
434
작성한 질문수 5
StandardScaler()
KMeans()
객체 생성 후 fit_transform(), fit() 으로 학습데이터 만들기 하는데, 모두 훈련데이터니까...
둘다 fit(), 또는 fit_transform()으로 구분없이 사용해도 되는건가요?
아니면... 구분지어야 하는 이유가 있는건지 궁금합니다.
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
따숩게님, 질문 주셔서 감사합니다.
StandardScaler()와 KMeans()와 같은 사이킷런 라이브러리에서 제공하는 메서드를 사용할 때 fit과 fit_transform의 차이를 이해하는 것이 중요합니다.
fit 메서드는 데이터에 대한 학습만을 수행합니다. 즉, 데이터를 바탕으로 필요한 통계치(예를 들어, 평균과 표준편차 등)를 계산하고 모델을 학습시키는데 사용됩니다.
fit_transform 메서드는 학습을 수행하는 동시에, 학습된 파라미터로 데이터를 변환하는 작업도 거칩니다. 예를 들어, StandardScaler의 경우 학습 데이터를 표준화하는 과정으로, 각 특성의 평균을 0, 표준편차를 1로 만드는 변환을 수행합니다.
KMeans 알고리즘의 경우,
- fit은 클러스터 중심을 계산하고 데이터를 클러스터에 할당하는 과정을 거칩니다.
- fit_transform은 fit을 수행하고, 추가로 각 데이터 포인트를 클러스터 중심으로부터의 거리로 변환하는 과정을 포함합니다.
따라서 fit과 fit_transform을 사용할 때에는, 만약 변환된 데이터를 바로 사용하고 싶다면 fit_transform을, 단순히 모델을 학습시키기만 하고 싶다면 fit을 사용하면 됩니다. 다만, fit_transform은 일반적으로 학습 데이터에만 적용하고, 테스트 데이터는 따로 transform 메서드를 통해 변환하는 것이 일반적입니다. 이는 데이터의 정보 누설을 막고 모델의 일반화 능력을 평가하는 데 도움이 되기 때문입니다.
질문에 대한 답이 되었길 바라며, 더 궁금한 점이 있으시면 언제든지 문의해주시기 바랍니다.
대응표본검정 레빈
0
13
2
단일표본검정 문제 유형
0
16
2
[작업형 3] 6~7. 카이제곱 검정
0
15
2
시스템 아키텍처를 강의에 나온 것 처럼 그리고 싶은데 공유 가능할까요?
1
11
2
9회 작업형3 문제 1-1
0
19
2
최종답안 계산 방식 질문
0
14
1
PROJECT_STRUCTURE.md 파일 공유좀 해주세요
0
13
2
맥북에서 아이패드로 연결해서 보려고 하면 화면이 안뜹니다.
0
2
1
시험 치기 전 급하게 질문 사항
0
24
2
노션 사용권한 불편합니다.
0
11
2
유형3
0
23
2
작업형 2 연습문제 섹션 3
0
17
2
dags_email_on_failure
0
9
1
11 기출문제 ipynb파일
0
21
2
작업형 3 유형
0
21
2
session이 점점 길어지면 어떻게 대처하나요?
1
16
1
11회 기출 유형(작업형1) 2번 정답
0
18
2
f1 score 질문
0
19
2
10회 작업형 2 인코딩 질의
0
16
2
머신러닝 - surprise 모듈 설치 오류
0
371
1
K-평균(실습#3) 결과 값이 왜 다르게 나올까요?
0
245
1
다항회귀(실습#2)
0
276
1
선형 회귀
0
410
0
협업(리뷰 기반)필터링#1 질문
0
908
1





