inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

[8/21] 날짜를 통한 데이터 타입 변경과 파생변수 만들기

공공데이터 자료 For문으로 반복작업

686

kljwjw1015

작성한 질문수 3

1

안녕하세요, 선생님 

강의를 통해서 많은 부분을 배우고 있습니다. 글이지만 감사드립니다.

제가 선생님 강의를 통해 공공데이터 포털에서 아파트 실거래가의 시각화를 나름 실습해 보고 있습니다.

아파트 실거래가는 월별자료만 제공하고 있어, 기간을 반복적으로 수집하여 DataFrame으로 변환코자 아래의 코드로 실행하면

 

 

period=['202001','202002']

 

df_sum=pd.DataFrame()

 

for time in period:

    params ={'serviceKey' :key , 'LAWD_CD' : '11560', 'DEAL_YMD' : time}

    res=requests.get(url,params=params)

    resp=res.content.decode('utf-8')

    data=xmltodict.parse(resp)

    df=pd.DataFrame(data['response']['body']['items']['item'])

    df_sum.append(df)

 

-------error message-------------

ChunkedEncodingError: ("Connection broken: ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, None)", ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, None))
----------------------------------------

네트워크나 서버의 문제로 인식하고 for문이 아닌 단순 크롤링 문으로 읽어오면 정상적으로 작동됩니다.

일주일째 여러가지 xml파싱을 바꾸어보고 여러가지로 시도해보고 있지만 풀리지가 않아 죄송하지만 질문올려 봅니다.

 

pandas python numpy

답변 2

0

kljwjw1015

감사합니다!. 추천해주신대로 해서 검토해 보겠습니다. 

 

0

박조은

안녕하세요.

다른 예제로 응용을 해보고 계시다니 멋집니다!

올려주신 코드만으로는 어떤 부분 때문에 오류가 났는지 알 수 없습니다.

또, 어떤 주소에 접근했는지도 알수 없고요.

API를 사용해서 받아온 것 같은데 제공하고 있는 문서를 읽어보고 받아온 key 값도 잘 넣어졌는지 확인해 보세요!

또, XML 을 파싱 할 때는 BeautifulSoup 을 사용하는 것도 추천합니다.

BeautifulSoup xml 로 검색해 보세요!

화이팅 입니다.

패키지 설치 에러 ydata-profiling

0

136

2

자세한 설명 부탁드려요 ㅜ

0

201

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

312

2

value_counts와 count 차이

0

403

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

223

3

scatterplot질문

0

135

1

강의 화면이 안나옵니다

0

174

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

197

2

에러 메시지

1

314

2

그래프 색이 동일하게 나옵니다.

0

332

2

시각화 라이브러리 비교

0

407

2

주피터 노트북 설치

0

399

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

235

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

189

1

group by agg function failed 에러

0

698

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

298

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

376

3

get_string함수에서 문자 'nan'

0

206

1

seaborn X축 시작 지점 조정 질의의 건

0

231

1

14강 distplot 질의

0

301

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

494

1

corr = df.corr() 입력시 오류

1

389

1

keyword grid_b is not recognized

0

344

1

%ls data 매직커맨드 사용시 한글 깨짐

0

306

1