통계분석 매출 기준비중에 따른 고객수 추출
dls1004 - '통계분석을 활용한 인사이트 도출' 강의 중
매출 상위 0.5% 금액이 왜 3시그마가 되는 건가요?(그냥 표준편차에 대한 개념이라 외우는건지..)
이론에서는 상위 2.5% (매출의 95%의 비중) 까지 나왔고
0.5%에 대한 언급이 따로 없고이바로 개념을 적용하신 것 같아서 질문드립니다.
추가로 교재에 내용에 있는 것 처럼 상위 1%, 같은 상위5%, 10% 이런 식으로 다른 비율로 도출해야할 때에는 어떤 방법을 활용하면 될까요?
(예를들어 누계비율이 아닌 다른 기준으로 설정을 한다던지, 표준편차를 적용하지 않더라도 활용법에 대해 설명해주시면 감사하겠습니다.)
Answer 1
0
안녕하세요, 인프런 AI 인턴입니다.
님의 질문은 데이터 분석과 관련된 학습 콘텐츠에 대한 것으로 보이는데요, 제공된 정보 중에서 곧바로 관련된 내용을 찾을 수 없습니다. 하지만, 일반적인 데이터 분석 이론을 바탕으로 답변드리겠습니다.
매출의 상위 0.5%가 3시그마로 표현되는 것은 정규 분포의 특성에서 비롯됩니다. 정규 분포에서는 데이터의 약 68.2%가 평균에서 표준편차 1시그마 내에, 약 95.4%가 2시그마 내에, 그리고 약 99.7%가 3시그마 내에 위치합니다. 따라서, 매출의 상위 0.5%가 3시그마에 해당한다면 이는 매출 데이터가 정규 분포를 따른다고 가정했을 때의 이론적 추정일 수 있습니다.
상위 1%, 5%, 10% 등 다른 비율로 매출 등의 데이터를 분석할 때는 분위수(Quantile) 또는 백분위수(Percentile)을 활용할 수 있습니다. 이는 전체 데이터를 백분율로 나눈 값에서 특정 위치의 값을 찾는 방법으로, 데이터의 분포가 정규 분포를 따르지 않을 경우에도 적용 가능합니다. 예를 들어, 상위 5%에 해당하는 값을 찾고자 한다면, 전체 데이터의 95번째 백분위수를 계산하게 됩니다.
누계 비율이 아닌 다른 기준을 설정할 때는 데이터의 특성과 분석 목적에 따라 다양한 통계적 방법을 활용할 수 있습니다. 정규 분포를 가정할 수 없는 경우, 비모수적 방법이나, 변환을 통해 데이터를 정규 분포에 가깝게 만든 뒤 분석하는 방법 등이 있습니다.
데이터 분석에는 다양한 접근 방법이 있기 때문에, 학습하고 계신 강의 내용을 바탕으로 추가로 학습하거나, 관련된 더 구체적인 예시와 함께 질문하시면 더욱 도움이 될 수도 있습니다.
4-7강 음성이 안나옵니다
0
24
2
자료 다운로드 오류
0
22
2
쿼리 오류 메세지
1
36
2
그룹화
1
45
2
GPT 버전 문의
0
29
1
파일 병합 화면이 아닌 편집 화면 바로 뜨는 경우
1
52
2
강의 자료
0
44
1
강의자료 다운로드
0
55
1
구글 코랩이 아닌 아나콘다를 이용해서 수강해도 문제가 없을까요?
1
67
1
섹션2 강의들이 하얀 화면만 나오고 영상이 보이지 않아요.
0
74
1
cursor ai 설치 설정
0
203
3
18강, 19강 강의 영상이 동일한 것 같습니다.
0
38
1
dateif 함수 - 매월 말일 입력시 개월 수 다른 이유
0
71
2
#N/A 오류를 잡아라! - IFERROR 함수 문의드립니다
0
53
1
실기 문제
0
56
1
다른언어 개발
0
68
2
제 버전에서는 hwp.saveAs() 동작 안하는데요
0
92
2
4강 업무회이록 상단표 붙여넣기 오류
0
93
2
2강 불량 종류별 발생건수 집계표 작성하기
0
79
2
3-3 트랜잭션이란 무엇인가 강의자료는 없나요?
0
86
2
dls604 강의가 재생이 안됩니다.
0
320
2
Mac용 Excel 실습환경 구성
0
1093
1
dls506강의 끝이 짤린거 같아요.
0
272
1
영상 업로드 완료 시점
0
370
3

