Cộng đồng Hỏi & Đáp của Inflearn
히스토그림 단위 설정 이유
Viết
·
22
0
Sturges공식과 데이터 범위를 이용해 구한 폭은 6.xxx인데 왜 그룹화할 때는 단위를 10으로 잡는 건가요? 만약 편의를 위해 10 단위로 잡은 거라면 Sturges 공식을 이용할 필요가 없지 않나요?
통계
Câu trả lời 1
1
Masocampus
Người chia sẻ kiến thức
안녕하세요, 마소캠퍼스입니다.
문의 주신 내용대로 수행한 이유는, Sturges(스터지스) 공식은 '절대적인 법칙'이라기보다
'합리적인 시작점'을 제안하는 가이드라인이기 때문입니다.
6.xxx를 계급 구간으로 설정 시, 표를 보는 사람이 직관적으로 수치를 파악하기 어려우므로
시각화의 목적인 실무 커뮤니케이션에서는 해당 값을 따르는 것이 비효율적으로 변하게 됩니다.
추가로, Sturges 공식의 다른 한 가지 핵심은
전체 데이터를 몇 개의 구간으로 나눌지에 대한 기준을 제시하는 것에 있습니다.
6.xxx를 기준으로 구간을 나눴을 때 대략 몇 개의 계급이 나오는지 파악한다면,
해당 데이터에 적절한 계급 개수를 대략적으로 알 수 있게 됩니다.
이 경우 10 단위로 계급을 설정하는 등, 공식의 값과 다른 값을 계급으로 설정했을 때
히스토그램에 표현되는 데이터 특징이 왜곡되거나 하지 않는다면
10 등 직관적으로 파악이 쉬운 값으로 확정하는 방식으로 진행이 가능하니 참고 부탁드립니다.
감사합니다.
마소캠퍼스 드림.





