강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

윤우섭님의 프로필 이미지
윤우섭

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

사이킷런을 이용한 K-Means 군집화 실습 - 01

make_blobs

작성

·

243

0

make_blobs로 샘플데이터를 한번만들어보는 것으로 이해했습니다 혹시 centroid한 데이터밖에 만들지 못하나요? 다른경우는 다른 API를 사용해야하나요? 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

다른 경우라고 하심은 어떤 경우인지요?

make_blobs는 주로 centroid 데이터를 만드는데 사용됩니다.

여러가지 유형을 가진 데이터세트를 만드는데는 sklearn.datasets내의 모듈들이 사용됩니다.

가령 make_circles는 원형으로 분포된 데이터 세트를 만듭니다.

make_classifications는 centroid이지만 classification까지 포함된 데이터 세트를 만듭니다.

그외에도 달 형태로 분포된 데이터 세트를 만드는 make_moons 도 있습니다.

보다 다양한 데이터 세트는 https://scikit-learn.org/stable/modules/classes.html#module-sklearn.datasets 에서 sample generator 부분을 참조해 주시기 바랍니다.

감사합니다.

윤우섭님의 프로필 이미지
윤우섭

작성한 질문수

질문하기