inflearn logo
강의

Course

Instructor

[Renewal] Python Introduction and Web Crawling Basics Bootcamp [Python, Web, and Data Understanding Fundamentals] (Updated)

공공데이터 OpenAPI시 문의

288

toaehddn

29 asked

0

안녕하세요, 강사님.
 
강의때 예시로 들어주신 공공데이터를 하다가 아래와 같은 난관에 봉착해서 문의드립니다.
 
분명히 공공데이터에서 예시로 구현해보면 왼쪽그림처럼 거래금액이나 건축년도도 xml의 하나의 태그로 보여지는데,
파이썬에서 찾아가면 <거래금액> 이 &lt;거래금액&gt; 로 바뀌어서 나옵니다.
그러다보니까 자연스럽게 tag로 find를하면 없다고 나오고요... 왜그런건가요?
(강의때 다뤄준 example하고 똑같진 않지만, 어떻게보면 tag로 찾아간다! 개념의 연장선에서 문의드립니다)
 

python 웹-크롤링

Answer 2

0

toaehddn

안녕하세요, 강사님.

우선 친절하신답변 감사드립니다.

 

답변을 제가 이해하기로는, jupyter에서 표현하는 방법이 다를뿐 실제는 find를하면 &lt; 를 <로 인식한다! 로 이해를 했는데요...

그런데 아래 보시면 (위코드이어서)

'item'으로 find한것은 잘 찾아가지만,

<거래금액>이 &lt;거래금액%gt;로 표현되어있지만, %lt;를 <로 인식한다고 생각해서 똑같이 find를하면 못찾아갑니다.

즉 표현하는방법이 &lt; 가 되는순간, 실제 그걸 <로 인식을 못하는것 같은데... 이럴땐 어떤걸 확인해봐야할까요?

0

funcoding

안녕하세요.

화면에 출력을 할 때, 해당 화면이 어떤 프로그램이냐(예를 들어, 터미널이냐, 특정 에디터냐?) 에 따라, 다르게 표시가 될 수 있어요. 일종의 인코딩과 관련된 문제라서요. <  이 표시가 또다르게 표시될 때는 &lt; 로 표시가 됩니다. 일종의 웹페이지를 표시하는 방식이라서요. 그것은 그래도 본연의 의미는 파싱하면서 처리를 하기 때문에 find 로 하면 &lt; 을 < 로 인지해서 그 안의 영문자가 태그라고 생각하고, 내용만 추출해서 보여주는 것입니다.

감사합니다.

크롤링, 영상을 따라해도 제미나에게 물어봐도 안되요

0

33

1

정규표현식 및 여러 코드 꼭 외워야 하나요?

0

40

1

리스트 함수형도 정수 데이터 받을 수 있나요?

0

46

1

크롤링 관련 질문

0

64

1

문제 답이 없는 버전은 없나요?

0

74

1

requests, BeautifulSoup 임포트 부분에 대해 문의드립니다.

0

83

1

업데이트 강의

0

98

2

선생님 강의중에서 sqlite3 강의를 제공한 강의가 있나요?

0

123

2

연습용 예제 파일

0

76

1

lxml 관련 오류

0

106

1

SAVE Request 창 띄우는 법

0

92

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다. 2

0

75

1

포스트맨 사용법이 바뀌어서 강의를 따라가지 못하겠습니다.

0

98

1

예제 2, 4, 6에 대한 풀이 방식 질문.

0

89

1

문제 파일

0

78

1

pdf 파일 내 코드 복붙시 공백

0

291

1

데이터 저장 강좌 문의 건

0

95

1

" " 와 ' '의 차이를 알고 싶습니다

0

243

1

Exercise 22. 문자열 다루기 (strip)

0

132

1

list함수로 리스트 선언하면 실패하는데 이유는 무엇입니까?

0

187

1

셀 삽입후 바로 기입이 가능합니까?

0

139

2

주피터 노트북 마우스 스크롤? 오류

0

1550

2

등호 2개('==')의 의미가 뭐죠?

0

460

2

페이지가 넘어갈 때 url 변하지 않는 경우

0

267

1