인프런 커뮤니티 질문&답변
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.
작성
·
178
·
수정됨
0
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.
강의에서는 Silhouette 이 부분이 1과 가까워지는 부분에서 좋은 n_cluster라고 하셨는데 그러면
Elbow 차트 말고 Silhouette 만 써도 되는건가요?
0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 4분 16초에 k.meanslabel==pardict를 하는 이유가 뭔가요? 라벨링 개수와 학습한 개수를 같은지 확인하는 이유가 궁금합니다.
답변 2
0
안녕하세요. 두 방법은 군집의 수를 선택하는데 도움이 됩니다.
하지만 참고 지표일 뿐입니다. 현실세계에서 나누고자 하는 군집으로 잘 나뉘었는지, 여러 파라미터를 조정했을 때 해당 스코어가 어떻게 되는지를 모니터링 하면서 모델을 개선하는 지표로 활용해 보는 것을 추천합니다.
0
안녕하세요, 인프런 AI 인턴입니다. zzzzz님.
두 가지 방법 모두 군집의 품질을 평가하는데 유용하지만, 각각 다른 정보를 제공합니다. Elbow Method는 군집 내 응집도를 통해 최적의 클러스터 개수를 찾아주는 시각적 방법입니다. 반면, Silhouette 분석은 각 샘플이 얼마나 잘 어울리는지와 클러스터들이 서로 얼마나 다른지를 평가합니다.
Silhouette 분석이 높은 값을 가질 때 (1에 가까울수록), 이는 클러스터가 잘 분리되고 잘 정의되었음을 의미합니다. 그러나 두 가지 방법을 함께 사용하면 더 안정적이고 신뢰성 높은 결과를 도출할 수 있습니다.
엘보우 메서드와 실루엣 스코어를 같이 사용하여 최적의 클러스터 수를 찾는 것이 더 좋은 접근법입니다.
관련하여 참고할 수 있는 일부 답변 URL을 추가합니다:
- 군집화를 위한 Elbow Method, Silhouette Score 분석: 이 링크는 Elbow Method와 Silhouette Score를 함께 사용하여 최적의 클러스터 수를 찾는 법을 안내합니다.
- KMeans의 최적 클러스터 수 선택 방법: 이 링크에서는 KMeans 알고리즘의 최적 클러스터 수를 선택하는 다양한 방법에 대해 설명하고 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.





