인프런 커뮤니티 질문&답변
가까운 데이터에 의미
해결된 질문
작성
·
189
0
K-means Clustering 에서 가까운 데이터 포인트 라는 문장들이 나오는데 데이터들이 가깝다는게 어떤 의미인가요?
또 데이터들이 가까우면 왜 유사성이 높다는것을 유추할 수 있는건가요?
답변 1
1
권 철민
지식공유자
안녕하십니까,
개별 데이터 포인트간의 유클리디안 거리가 가깝다고 생각하시면 됩니다.
거리가 가깝다는 것은 데이터 포인트의 값이 서로 비슷하다는 의미인데, 예를 들어 개별 데이터가 (연령, 키) 두개의 피처를 가지고 있는 데이터라고 하면 A데이터는 (20, 170), B데이터는 (21, 172), C데이터는 (25, 180)로 가정하면 A와 B가 거리가 더 가까우며 A,B는 서로 유사성이 높습니다.
감사합니다.





