강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

예찬님의 프로필 이미지
예찬

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

군집화 개요 및 K-Means 군집화의 이해

가까운 데이터에 의미

해결된 질문

작성

·

189

0

K-means Clustering 에서 가까운 데이터 포인트 라는 문장들이 나오는데 데이터들이 가깝다는게 어떤 의미인가요?
또 데이터들이 가까우면 왜 유사성이 높다는것을 유추할 수 있는건가요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

개별 데이터 포인트간의 유클리디안 거리가 가깝다고 생각하시면 됩니다. 

거리가 가깝다는 것은 데이터 포인트의 값이 서로 비슷하다는 의미인데, 예를 들어 개별 데이터가 (연령, 키) 두개의 피처를 가지고 있는 데이터라고 하면 A데이터는 (20, 170), B데이터는 (21, 172), C데이터는 (25, 180)로 가정하면 A와 B가 거리가 더 가까우며 A,B는 서로 유사성이 높습니다. 

감사합니다. 

예찬님의 프로필 이미지
예찬

작성한 질문수

질문하기