inflearn logo
강의

Course

Instructor

[Revised Edition] The Complete Guide to Python Machine Learning

GMM clustering practice using scikit-learn

GMM관련해서 질문드립니다.

Resolved

285

JeHeon Park

9 asked

0

GMM은 정규분포를 가정하고 데이터셋을 군집화 한다고 설명하셨습니다. 그러면 정규분포함수의 밀도가 가장높은 지점이 각군집의 센터라고 생각할 수 없나요? 혹시 이 센터를 쉽게 구할수 있는 함수는 없나요?

머신러닝 배워볼래요? 통계 python

Answer 2

0

JeHeon Park

항상 좋은 답변 감사합니다.

0

dooleyz3525

안녕하십니까,

군집 중심점이라는 것이 군집화 내에 여러 데이터 포인트들이 거리 중심점이라는 개념이 강해서 사이킷런의 GMM에서는 군집 중심점을 구할수 있는 함수가 없습니다. 하지만 말씀하신대로 GMM의 군집 중심점(센터)을  정규분포함수의 밀도가 가장높은 지점으로 간주 할 수도 있습니다.

아쉽게도 이걸 어떻게 구해야 할지 사이킷런의 GaussianMixture 객체에서 찾지를 못했습니다.  GaussianMixture 객체의 means_와 covariance_를 잘 조합해서 밀도를 추정한 뒤 가장 높은 밀도를 가지는 중심점을 찾을 수도 있을 것 같습니다만, 정확한 방법은 현재는 잘 모르겠습니다.

좋은 질문 감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

63

2

정수 인덱싱

0

68

2

넘파이 오류

0

85

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

79

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

70

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

117

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

100

2

분류 평가 정확도 예측

0

77

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

99

1

카카오톡 채널 있나요

0

107

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

190

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

172

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

148

2

실루엣 스코어..

0

86

2

float64 null 값 처리 방법

0

103

2