inflearn logo
강의

Course

Instructor

Statistics Analysis Master Class

PST1501 – Histogram

히스토그림 단위 설정 이유

64

yun

1 asked

0

 Sturges공식과 데이터 범위를 이용해 구한 폭은 6.xxx인데 왜 그룹화할 때는 단위를 10으로 잡는 건가요? 만약 편의를 위해 10 단위로 잡은 거라면 Sturges 공식을 이용할 필요가 없지 않나요?

통계

Answer 1

1

Masocampus

안녕하세요, 마소캠퍼스입니다.

 

문의 주신 내용대로 수행한 이유는, Sturges(스터지스) 공식은 '절대적인 법칙'이라기보다
'합리적인 시작점'을 제안하는 가이드라인이기 때문입니다.

 

6.xxx를 계급 구간으로 설정 시, 표를 보는 사람이 직관적으로 수치를 파악하기 어려우므로
시각화의 목적인 실무 커뮤니케이션에서는 해당 값을 따르는 것이 비효율적으로 변하게 됩니다.

추가로, Sturges 공식의 다른 한 가지 핵심은
전체 데이터를 몇 개의 구간으로 나눌지에 대한 기준을 제시하는 것에 있습니다.
6.xxx를 기준으로 구간을 나눴을 때 대략 몇 개의 계급이 나오는지 파악한다면,
해당 데이터에 적절한 계급 개수를 대략적으로 알 수 있게 됩니다.

이 경우 10 단위로 계급을 설정하는 등, 공식의 값과 다른 값을 계급으로 설정했을 때
히스토그램에 표현되는 데이터 특징이 왜곡되거나 하지 않는다면
10 등 직관적으로 파악이 쉬운 값으로 확정하는 방식으로 진행이 가능하니 참고 부탁드립니다.

감사합니다.

마소캠퍼스 드림.

 

R 코드 페이지에 대한 공부 목적..

0

30

1

안녕하세요 열심히 수강중인 학생입니다

0

63

2

변수 변환 기출변형 문제 질문

0

89

3

정수 인덱싱

0

68

2

시계열 특징(기출문제문의)

0

83

2

차원 축소 개념-차원의 저주

0

84

2

최적회귀방정식 선택 관련 내용 중

0

64

2

넘파이 오류

0

85

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

기출 유형 중 내용 설명 누락 건

0

84

1

과목별 강의 구성

0

80

2

Normalization & Regularization (정규화, 표준화, 정칙화) 강의내용 중 이상한 부분이 있어서 문의 드립니다..

0

57

1

26년 1회차 준비 가능할까요?

0

96

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

79

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

70

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

84

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

이원배치 분산분석에서 정규성 검정 방법

0

74

1

리스크 수준의 의미

0

59

2

데이터 크롤링-웹에서 가져오기가 안되요

0

79

1

다중 선형회귀 분석 등

0

233

1

kess 는 어디서 다운받나요?

0

874

1