인프런 커뮤니티 질문&답변
GMM관련해서 질문드립니다.
해결된 질문
작성
·
260
0
GMM은 정규분포를 가정하고 데이터셋을 군집화 한다고 설명하셨습니다. 그러면 정규분포함수의 밀도가 가장높은 지점이 각군집의 센터라고 생각할 수 없나요? 혹시 이 센터를 쉽게 구할수 있는 함수는 없나요?
답변 2
0
0
권 철민
지식공유자
안녕하십니까,
군집 중심점이라는 것이 군집화 내에 여러 데이터 포인트들이 거리 중심점이라는 개념이 강해서 사이킷런의 GMM에서는 군집 중심점을 구할수 있는 함수가 없습니다. 하지만 말씀하신대로 GMM의 군집 중심점(센터)을 정규분포함수의 밀도가 가장높은 지점으로 간주 할 수도 있습니다.
아쉽게도 이걸 어떻게 구해야 할지 사이킷런의 GaussianMixture 객체에서 찾지를 못했습니다. GaussianMixture 객체의 means_와 covariance_를 잘 조합해서 밀도를 추정한 뒤 가장 높은 밀도를 가지는 중심점을 찾을 수도 있을 것 같습니다만, 정확한 방법은 현재는 잘 모르겠습니다.
좋은 질문 감사합니다.





