강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của fpahsqlcj6392
fpahsqlcj6392

câu hỏi đã được viết

Phân tích văn bản tiếng Hàn và xử lý ngôn ngữ tự nhiên với Python cho mọi người

0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.

Viết

·

198

·

Đã chỉnh sửa

0

  1. 0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.

강의에서는 Silhouette 이 부분이 1과 가까워지는 부분에서 좋은 n_cluster라고 하셨는데 그러면

Elbow 차트 말고 Silhouette 만 써도 되는건가요?

  1. 0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 4분 16초에 k.meanslabel==pardict를 하는 이유가 뭔가요? 라벨링 개수와 학습한 개수를 같은지 확인하는 이유가 궁금합니다.

python머신러닝빅데이터NLP텍스트마이닝data-clustering데이터-리터러시

Câu trả lời 2

0

todaycode님의 프로필 이미지
todaycode
Người chia sẻ kiến thức

안녕하세요. 두 방법은 군집의 수를 선택하는데 도움이 됩니다.

하지만 참고 지표일 뿐입니다. 현실세계에서 나누고자 하는 군집으로 잘 나뉘었는지, 여러 파라미터를 조정했을 때 해당 스코어가 어떻게 되는지를 모니터링 하면서 모델을 개선하는 지표로 활용해 보는 것을 추천합니다.

 

0

안녕하세요, 인프런 AI 인턴입니다. zzzzz님.

두 가지 방법 모두 군집의 품질을 평가하는데 유용하지만, 각각 다른 정보를 제공합니다. Elbow Method는 군집 내 응집도를 통해 최적의 클러스터 개수를 찾아주는 시각적 방법입니다. 반면, Silhouette 분석은 각 샘플이 얼마나 잘 어울리는지와 클러스터들이 서로 얼마나 다른지를 평가합니다.

Silhouette 분석이 높은 값을 가질 때 (1에 가까울수록), 이는 클러스터가 잘 분리되고 잘 정의되었음을 의미합니다. 그러나 두 가지 방법을 함께 사용하면 더 안정적이고 신뢰성 높은 결과를 도출할 수 있습니다.

엘보우 메서드와 실루엣 스코어를 같이 사용하여 최적의 클러스터 수를 찾는 것이 더 좋은 접근법입니다.

관련하여 참고할 수 있는 일부 답변 URL을 추가합니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Hình ảnh hồ sơ của fpahsqlcj6392
fpahsqlcj6392

câu hỏi đã được viết

Đặt câu hỏi