• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    해결됨

sns.barplot()의 결과 그래프 해석

21.01.10 18:49 작성 조회수 3.32k

1

안녕하세요? 위의 그림에서 막대그래프 자체는 각 연도별 평균 평당분양가격이라는 것은 이해했습니다. 

각 막대 그래프 끝의 검은 선은 무엇을 의미하는 것인가요? 답변 부탁드립니다~

답변 2

·

답변을 작성해보세요.

1

asdfs1님의 프로필

asdfs1

질문자

2021.01.15

자세한 설명 감사합니다~

0

안녕하세요.

해당 검은 막대는 신뢰구간을 의미하게 됩니다.

[신뢰 구간 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EC%8B%A0%EB%A2%B0_%EA%B5%AC%EA%B0%84)

신뢰 구간은 보통 표본에서 산출된 통계와 함께 제공된다. 예를 들어, "신뢰수준 95%에서 투표자의 35%~45%가 A후보를 지지하고 있다."라고 할 때 95%는 신뢰수준이고 35%~45%는 신뢰구간이며 θ는 A후보의 지지율이다.

해당 기능에서  shift+tab+tab 키를 누르면 도움말을 보실 수 있는데 이 때 ci의 도움말을 보실 수 있어요.

아래 링크에서도 도움말을 볼 수 있는데요.

[seaborn.barplot — seaborn 0.11.1 documentation](https://seaborn.pydata.org/generated/seaborn.barplot.html#seaborn.barplot)

 막대는 ci 신뢰구간으로 다음의 도움말을 봐야 해요.


____________________________________________________

cifloat or “sd” or None, optional

Size of confidence intervals to draw around estimated values. If “sd”, skip bootstrapping and draw the standard deviation of the observations. If None, no bootstrapping will be performed, and error bars will not be drawn.

n_bootint, optional

Number of bootstrap iterations to use when computing confidence intervals.

번역기를 돌리면 위의 문장을 다음과 같이 해석하는데요.

cifloat 또는 "sd"또는 None, 선택 사항

추정값 주위를 그리는 신뢰 구간의 크기입니다. "sd"인 경우 부트 스트랩을 건너 뛰고 관측 값의 표준 편차를 그립니다. None이면 부트 스트랩이 수행되지 않고 오차 막대가 그려지지 않습니다.

n_bootint, 선택 사항

신뢰 구간을 계산할 때 사용할 부트 스트랩 반복 횟수입니다.

____________________________________________________

ci는 n_boot의 값 만큼 샘플링을 했을때 95%로 해당 검은색 막대에 값이 있다는 것을 신뢰할 수 있다는 의미입니다.

보통 신뢰구간은 우리가 선거철에 출구조사 관련 뉴스나 기사에서 자주 보게 됩니다.

그런데 이 신뢰구간은 데이터가 적을 때는 그리는데 문제가 되지 않는데 데이터가 많을 때는 그릴 때 속도가 오래 걸립니다.

그래서 데이터가 많을 때는 ci=None 으로 설정하면 빠르게 그래프를 그려볼 수 있어요.

또, ci="sd"로 설정하면 표준편차를 그립니다.

다음 기사도 함께 읽어보세요.

[Cover Story 여론조사 바로 읽기… 신뢰수준 95 오차 ±31포인트 | 한경닷컴](https://www.hankyung.com/news/article/2015021392051)