• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

군집분석은

22.08.24 22:50 작성 조회수 167

0

군집분석은 데이터 전처리에 해당하는 내용인가요?

Data Segmentation 과정에서 Cluster Analysis를 수행하는 것으로 알고 있는데, 앞서 질문이 맞다면 이 과정을 수행해서 어떤 결과물을 얻고 그 결과물은 앞으로의 분석 프로세스에서 어떻게 활용되는 지 궁금합니다.

답변 3

·

답변을 작성해보세요.

0

안녕하세요! 소확성입니다.
두 번째 질문에 대해서는 교수님의 답변이 아니라 운영자가 정리한 내용으로 대신해 드립니다.

데이터 전처리는 데이터 분석과정에서 반드시 거쳐야 하는 과정이며, 결과에 직접적인 영향을 끼치므로 반복적으로 수행해야 합니다. 데이터 전처리는 데이터 정제 -> 결측값 처리 -> 이상값 처리 -> 분석 변수 처리의 단계를 거쳐 데이터의 품질이 목적에 맞는지 확인하고 필요하면 품질을 높이는 작업이라고 할 수 있습니다.

이에 반해 군집분석은 변수 유사성에 기초하여 N개의 군집으로 데이터를 집단화하는 기법으로 주로 분석 초기에 데이터 특성 파악을 위해 사용하는 것입니다.

 

0

김재현님의 프로필

김재현

질문자

2022.09.04

그렇다면 전처리라기보다는 모형 선정에 도움을 주는 분석 정도로 활용하거나 군집 분석 결과를 분석에 활용할 수 있다면 사용라는 정도의 개념이라 이해하면 될까요?

0

안녕하세요! 소확성입니다.
문의주신 내용에 대해 답변 드립니다.

군집분석은 데이터 전처리 과정이 아닙니다. 
Data Segmentation을 하기 위해 군집분석을 보통 사용하지만 그렇다고 데이터 전처리 과정으로 보지는 않구요.  고객 세분화 등의 목적을 위해 군집분석 기법을 사용하는 것입니다.
군집분석의 결과로 인사이트를 얻는 데 그치기도 하고(ex. 마케팅 영역) 분류된 군집을 파생변수로 사용할 수도 있고, 각 군집별로 각각 모델링을 해서 specific한 모델을 만들어낼 수도 있습니다.^^

답변이 학습에 도움이 되길 바라겠습니다.
감사합니다.