inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

안녕하세요 강사님 chapter[9/20] boxplot 관련해서 질문 드립니다.

246

작성자 없음

작성한 질문수 0

1

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import re
import seaborn as sns
plt.rc('font',family='Malgun Gothic')

df1=pd.read_csv("전국 평균 분양가격(2013년 9월부터 2015년 8월까지).csv",header=0,index_col=0,
                encoding='cp949')
df2=pd.read_csv("주택도시보증공사_전국 평균 분양가격(2019년 12월).csv",header=0,index_col=0,
                encoding='cp949')


df2["분양가격(㎡)"]=pd.to_numeric(df2["분양가격(㎡)"],errors="coerce")
df2["분양가/평"]=(df2["분양가격(㎡)"]*3.3)

df2["전용면적"]=df2["규모구분"].str.replace("전용면적","")
df2["전용면적"]=df2["전용면적"].str.replace("초과","~")
df2["전용면적"]=df2["전용면적"].str.replace("이하","")
df2["전용면적"]=df2["전용면적"].str.strip()
df2["지역명"]=df2.index

df2.drop("규모구분",axis=1,inplace=True)

df2=df2.reset_index(drop=True)

fig,ax=plt.subplots(1,1,figsize=(15,15))

pdf=pd.pivot_table(df2,values="분양가/평",index="월",columns="연도")
pdf2=pd.pivot_table(df2,values="분양가/평",columns="연도").T

pdf.plot.box(ax=ax)

 

 

여기까지는 잘 작동이 되는데요...

 

이 박스플롯에, 전체 평균을 오버랩 시켜서 그려보려고 했어요.

 

fig,ax=plt.subplots(1,1,figsize=(15,15))

pdf=pd.pivot_table(df2,values="분양가/평",index="월",columns="연도")
pdf2=pd.pivot_table(df2,values="분양가/평",columns="연도").T


pdf.plot.box(ax=ax)
pdf2.plot(ax=ax)

 

월로 세분화 되지 않은 , 연도별 총합 평균으로 구성한  dataframe을 ax에 그렸는데 안되더라구요.

twinx 메소드로도 되지 않아요.

이런식으로 모든 연도가 가장 왼쪽에 박혀버립니다..

문제가 무엇일까요

python numpy pandas

답변 1

0

박조은

안녕하세요.

T로 전치해주었다면 index 값이 "연도"가 아니겠네요.

인덱스 값이 같아야지 "연도"별로 값을 표시해 줄 수있습니다.

또, 선 그래프로 그렸을 때 잘 안 보인다면 일단 kind="bar" 혹은 .bar()를 통해 막대그래프로 그려보세요!

패키지 설치 에러 ydata-profiling

0

134

2

자세한 설명 부탁드려요 ㅜ

0

200

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

308

2

value_counts와 count 차이

0

374

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

217

3

scatterplot질문

0

132

1

강의 화면이 안나옵니다

0

174

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

193

2

에러 메시지

1

311

2

그래프 색이 동일하게 나옵니다.

0

328

2

시각화 라이브러리 비교

0

400

2

주피터 노트북 설치

0

399

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

233

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

184

1

group by agg function failed 에러

0

696

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

295

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

372

3

get_string함수에서 문자 'nan'

0

205

1

seaborn X축 시작 지점 조정 질의의 건

0

229

1

14강 distplot 질의

0

299

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

486

1

corr = df.corr() 입력시 오류

1

383

1

keyword grid_b is not recognized

0

342

1

%ls data 매직커맨드 사용시 한글 깨짐

0

304

1