• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

공공데이터 자료 For문으로 반복작업

22.05.18 22:36 작성 조회수 465

1

안녕하세요, 선생님 

강의를 통해서 많은 부분을 배우고 있습니다. 글이지만 감사드립니다.

제가 선생님 강의를 통해 공공데이터 포털에서 아파트 실거래가의 시각화를 나름 실습해 보고 있습니다.

아파트 실거래가는 월별자료만 제공하고 있어, 기간을 반복적으로 수집하여 DataFrame으로 변환코자 아래의 코드로 실행하면

 

 

period=['202001','202002']

 

df_sum=pd.DataFrame()

 

for time in period:

    params ={'serviceKey' :key , 'LAWD_CD' : '11560', 'DEAL_YMD' : time}

    res=requests.get(url,params=params)

    resp=res.content.decode('utf-8')

    data=xmltodict.parse(resp)

    df=pd.DataFrame(data['response']['body']['items']['item'])

    df_sum.append(df)

 

-------error message-------------

ChunkedEncodingError: ("Connection broken: ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, None)", ConnectionResetError(10054, '현재 연결은 원격 호스트에 의해 강제로 끊겼습니다', None, 10054, None))
----------------------------------------

네트워크나 서버의 문제로 인식하고 for문이 아닌 단순 크롤링 문으로 읽어오면 정상적으로 작동됩니다.

일주일째 여러가지 xml파싱을 바꾸어보고 여러가지로 시도해보고 있지만 풀리지가 않아 죄송하지만 질문올려 봅니다.

 

답변 2

·

답변을 작성해보세요.

0

kljwjw1015님의 프로필

kljwjw1015

질문자

2022.05.18

감사합니다!. 추천해주신대로 해서 검토해 보겠습니다. 

 

0

안녕하세요.

다른 예제로 응용을 해보고 계시다니 멋집니다!

올려주신 코드만으로는 어떤 부분 때문에 오류가 났는지 알 수 없습니다.

또, 어떤 주소에 접근했는지도 알수 없고요.

API를 사용해서 받아온 것 같은데 제공하고 있는 문서를 읽어보고 받아온 key 값도 잘 넣어졌는지 확인해 보세요!

또, XML 을 파싱 할 때는 BeautifulSoup 을 사용하는 것도 추천합니다.

BeautifulSoup xml 로 검색해 보세요!

화이팅 입니다.