inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[11/20] seaborn 으로 시각화 하기 - lineplot, relplot 으로 선그래프와 서브플롯 그리기

그림에서 보여지는 ci=95의 의미

724

freedom07

작성한 질문수 104

1

선생님 신뢰구간의 의미는 아는데요..

그래프에서 검정색으로 표시되는 것이..

 무슨의미를 이야기하는 건가요..?

예를 들어서 지역명 중에 '서울'로 자세히 이야기해주시면 감사하겠습니다..ㅠ

pandas numpy python

답변 1

0

박조은

안녕하세요. 검은 막대는 신뢰구간을 의미하게 됩니다.

[신뢰 구간 - 위키백과, 우리 모두의 백과사전](https://ko.wikipedia.org/wiki/%EC%8B%A0%EB%A2%B0_%EA%B5%AC%EA%B0%84)

신뢰 구간은 보통 표본에서 산출된 통계와 함께 제공된다. 예를 들어, "신뢰수준 95%에서 투표자의 35%~45%가 A후보를 지지하고 있다."라고 할 때 95%는 신뢰수준이고 35%~45%는 신뢰구간이며 θ는 A후보의 지지율이다.

해당 기능에서  shift+tab+tab 키를 누르면 도움말을 보실 수 있는데 이 때 ci의 도움말을 보실 수 있어요.

아래 링크에서도 도움말을 볼 수 있는데요.

[seaborn.barplot — seaborn 0.11.1 documentation](https://seaborn.pydata.org/generated/seaborn.barplot.html#seaborn.barplot)

 막대는 ci 신뢰구간으로 다음의 도움말을 봐야 해요.


____________________________________________________

cifloat or “sd” or None, optional

Size of confidence intervals to draw around estimated values. If “sd”, skip bootstrapping and draw the standard deviation of the observations. If None, no bootstrapping will be performed, and error bars will not be drawn.

n_bootint, optional

Number of bootstrap iterations to use when computing confidence intervals.

번역기를 돌리면 위의 문장을 다음과 같이 해석하는데요.

cifloat 또는 "sd"또는 None, 선택 사항

추정값 주위를 그리는 신뢰 구간의 크기입니다. "sd"인 경우 부트 스트랩을 건너 뛰고 관측 값의 표준 편차를 그립니다. None이면 부트 스트랩이 수행되지 않고 오차 막대가 그려지지 않습니다.

n_bootint, 선택 사항

신뢰 구간을 계산할 때 사용할 부트 스트랩 반복 횟수입니다.

____________________________________________________

ci는 n_boot의 값 만큼 샘플링을 했을때 95%로 해당 검은색 막대에 값이 있다는 것을 신뢰할 수 있다는 의미입니다.

보통 신뢰구간은 우리가 선거철에 출구조사 관련 뉴스나 기사에서 자주 보게 됩니다.

그런데 이 신뢰구간은 데이터가 적을 때는 그리는데 문제가 되지 않는데 데이터가 많을 때는 그릴 때 속도가 오래 걸립니다.

그래서 데이터가 많을 때는 ci=None 으로 설정하면 빠르게 그래프를 그려볼 수 있어요.

또, ci="sd"로 설정하면 표준편차를 그립니다.

다음 기사도 함께 읽어보세요.

[Cover Story 여론조사 바로 읽기… 신뢰수준 95 오차 ±31포인트 | 한경닷컴](https://www.hankyung.com/news/article/2015021392051)

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

341

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

213

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

477

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

292

1