inflearn logo
강의

Course

Instructor

[Revised Edition] The Complete Guide to Python Machine Learning

Clustering Performance Evaluation - Understanding Silhouette Analysis

실루엣 계수와 실루엣 스코어, 그리고 좋은 군집 판단의 객관적인 기준

611

anchornandary

11 asked

0

안녕하세요 실루엣 계수 및 실루엣 스코어 관련 강의를 들으면서 아래와 같이 궁금한점이 생겨서 질문드립니다!

  1. 실루엣 계수가 -1~1이고 ,이들의 평균인 실루엣 스코어가 0~1이라고 하셨는데, 범위가 -1~1인 숫자들끼리 평균을 내면 사실 이에대한 결과값인 실루엣스코어의 범위도 똑같이 -1~1이 되어야 할 것 같은데, 범위가 0~1인 이유가 궁금합니다!

  2. 좋은 군집을 판단하는 기준을 말씀하실 때 실루엣 스코어와 각 군집별 실루엣계수 평균값들의 편차를 동시에 고려해야 한다고 하셨습니다.

    다만 위와같은 판단 기준이 다소 애매모호해 보이는데 실무에서는 정확히 어떤 기준으로 위와같은 두 가지 판단기준을 '동시에&복합적으로' 고려하는지 예시가 궁금합니다.

    ex) 각 군집화 케이스별로 군집별 실루엣 계수의 평균값에대한 표준편차를 산출하고 이를 비교하고, 동시에 각 군집화 케이스별로 실루엣스코어를 산출하여 이 두 가지 값 중 어떤것에 우선순위를 두고 평가하는지 등

     

머신러닝 배워볼래요? 머신러닝 통계 통계 python

Answer 1

0

dooleyz3525

안녕하십니까,

  1. 실루엣 계수가 -1과 같이 마이너스 값이 되는 경우는 잘못된 클러스터에 데이터가 할당되는 경우인데, 이런 경우는 거의 발생하지 않습니다. 그러니까 실루엣 계수가 마이너스 값을 가지는 경우는 거의 없습니다. 물론 발생할 수도 있기에 가능 범위가 -1 ~ 1 사이가 될수는 있지만 현실적으로는 어렵기에 보통 0~1 사이로 실루엣 스코어가 발생한다라는 차원에서 이해해 주셨으면 합니다.

     

  2. 이건 뒷 강의에서 실습을 하면서 보다 자세하게 말씀드립니다. 이후 강의 2개를 들으시고도 여전히 이해가 부족하시다면 다시 질문 부탁드립니다.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

63

2

정수 인덱싱

0

68

2

넘파이 오류

0

85

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

79

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

70

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

117

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

100

2

분류 평가 정확도 예측

0

78

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

99

1

카카오톡 채널 있나요

0

107

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

190

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

172

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

148

2

실루엣 스코어..

0

86

2

float64 null 값 처리 방법

0

103

2