강의

멘토링

커뮤니티

Inflearn コミュニティ Q&A

jeheonpark930885 のプロフィール画像
jeheonpark930885

投稿した質問数

[改訂版] Python機械学習完全ガイド

サイキランを用いたGMM群集化実習

GMM관련해서 질문드립니다.

解決済みの質問

作成

·

268

0

GMM은 정규분포를 가정하고 데이터셋을 군집화 한다고 설명하셨습니다. 그러면 정규분포함수의 밀도가 가장높은 지점이 각군집의 센터라고 생각할 수 없나요? 혹시 이 센터를 쉽게 구할수 있는 함수는 없나요?

머신러닝 배워볼래요? 통계python

回答 2

0

JeHeon Park님의 프로필 이미지
JeHeon Park
質問者

항상 좋은 답변 감사합니다.

0

dooleyz3525님의 프로필 이미지
dooleyz3525
インストラクター

안녕하십니까,

군집 중심점이라는 것이 군집화 내에 여러 데이터 포인트들이 거리 중심점이라는 개념이 강해서 사이킷런의 GMM에서는 군집 중심점을 구할수 있는 함수가 없습니다. 하지만 말씀하신대로 GMM의 군집 중심점(센터)을  정규분포함수의 밀도가 가장높은 지점으로 간주 할 수도 있습니다.

아쉽게도 이걸 어떻게 구해야 할지 사이킷런의 GaussianMixture 객체에서 찾지를 못했습니다.  GaussianMixture 객체의 means_와 covariance_를 잘 조합해서 밀도를 추정한 뒤 가장 높은 밀도를 가지는 중심점을 찾을 수도 있을 것 같습니다만, 정확한 방법은 현재는 잘 모르겠습니다.

좋은 질문 감사합니다.

jeheonpark930885 のプロフィール画像
jeheonpark930885

投稿した質問数

質問する