• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

히스토그램의 y축 의미 질문

21.01.26 13:31 작성 조회수 259

0

안녕하세요.

시각화 우측에 히스토그램에서 y축이 의미하는 것이 무엇인지요?

X축은 AMT_CREDIT 값일텐데 y축은 어떻게 해석해야 하는지 궁금합니다. AMT_CREDIT을 예로 들면 단위가 1e-6  라서 단순히 비중(x축의 bin이 전체의 몇%를 차지하는지)은 아닌 것 같고, density 인가 추측해봅니다.

위와 별개로 kde 에서 density의 의미를 찾아봤으나 정확히 이해가 어려운데 설명해주실 수 있는지요?

답변 1

답변을 작성해보세요.

0

안녕하십니까,

seaborn의 distplot은 histogram을 측정할 x축의 값이 연속형 값으로 매우 많은 개별 값이 있을 경우 이를 가우스 분포와 같은 형태와 같은 거꾸로된 종모양의 확률 분포(Probability density)값으로 변경합니다. 이 거꾸로된 종모양의 전체 크기는 1이 됩니다.  이 전체 크기를 1이 되도록 Y값이 개별 x값 단위로 만들어지는데 x값이 너무 많아서 y값이 1e-6과 같이 작은 값으로 나타나게 되었습니다.

감사합니다.