inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 프로그래밍

교수님 강의 [웹자료 수집하기] 질문드립니다.

99

_지연

작성한 질문수 1

0

안녕하세요.

[섹션2. 파이썬 인공지능 활용]에서

웹 자료 수집하기 예시에 있는 "자동차 연비-한국에너지공단"사이트가 현재 변경된 것 같습니다.

(검색 시 보이지 않고, 링크를 똑같이 따라서 쳐봐도 사이트 오류로 나옵니다.ㅠㅠ)

그래서 데이터 테이블이 있는 다른 사이트에서 교수님의 방법으로 스크래핑을 하려는데..

교수님처럼 코랩에서 테이블 내용이 읽혀지지 않습니다.

 

교수님의 방식처럼 테이블 데이터가 코랩에서 읽혀지는 사이트나 혹시 제가 잘못 찾고 있다면, 해당 강의에서 예시로 삼은 자동차연비 사이트 링크 주소를 알 수 있을까요??이후 강의(판다스)에서도 이어지는 내용인것 같아, 수업을 따라가기 어려운 상황입니다.ㅠㅠ

도와주세요~!!

python 머신러닝 인공지능(ai)

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. _지연님.

웹 스크래핑 강의에서 예시로 사용된 사이트가 변경되어 불편을 겪고 계신 것 같네요. 웹 스크래핑은 대상 웹사이트가 변경되거나 폐쇄되었을 때 일반적으로 대체 가능한 데이터를 찾거나 과정을 수정할 필요가 있습니다.

  1. 자동차 연비 데이터: 한국에너지공단의 자동차 연비 데이터는 종종 웹사이트 구조가 변동될 수 있습니다. 이 경우 정부 데이터 포털을 통해 “자동차 연비” 관련 데이터를 검색하여 다운로드할 수 있는 경우도 있습니다.

  2. 대체 웹사이트: 강의에서 언급된 사이트가 불가능할 경우, 웹에서 데이터 테이블을 제공하는 다른 사이트, 예를 들어 Kaggle 등지에서 유사한 데이터를 얻어볼 수 있습니다.

  3. Python with Colab 사용법:

    • Colab에서 Pandas 라이브러리를 사용하여 테이블 데이터를 읽어올 때는 read_html 메서드를 사용할 수 있습니다. 목표 웹페이지가 잘 변환되지 않으면, 페이지의 HTML 구조를 파악하여 수동으로 각 셀 데이터를 파싱하는 방법을 고려해야 할 수 있습니다.
    • “pandas.read_html()“은 웹 페이지의 HTML 테이블을 파싱할 때 유용합니다. 페이지의 구조가 틀리면 BeautifulSoup과 같은 라이브러리를 활용하여 수작업이 필요할 수 있습니다.

강의에서 제시된 자동차 연비 데이터와 같은 문제를 겪는 경우에는 관련 섹션의 댓글이나 Q&A를 통해 다른 학습자들이 공유한 정보를 찾거나, 강사의 최신 답변을 받아보실 수 있습니다.

유사한 질문과 관련된 게시글로 아래 링크를 참고해 주시면 도움이 될 것입니다:
- 강의 자료 확인 방법에 대한 글
- 강의 자료 제공 관련 안내

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

화면구성

0

8

1

26년 1회실기

0

12

1

결제 후 강의 들은 후기

0

14

0

Monolith 아키텍쳐 질문

0

11

0

강의 자료 요청

0

17

2

수업 자료가 어디에 있나요?

0

34

3

클라우드플래어 배포 질문

0

16

2

26,27강 진행 간 노션, html 프롬프트 파일 불일치

0

16

3

<div id="banner">배너 이미지</div> 관련 질문

0

11

1

canva 인증 관련 질문

0

18

2

강의 자료

0

18

1

fatal: repository 'https://github.com/gymcoding/my-marketplace.git/' not found

0

16

2

변수 설정 시에 질문입니다.

0

11

2

27:15 break 출력

0

17

1

kaggle notebook에 service key 설정이 누락된 것 같습니다

1

22

2

live server, korean 을 검색해도 아무것도 나오지 않음

0

17

1

퍼블릭시티를 ai agent 제미나이로 대채

0

23

2

섹션2-18

0

20

2

텔레그램 User Info 채널이 없어요.

0

29

1

커서질문

0

25

1

SUPABASE에서 AOI 선택여부

0

21

2

클로드 코드 터미널 사용시 git, git 허브 활용 법

0

23

1

Colab에서 변수명을 그냥 입력하는 것과 print를 통해 보는 것의 차이

0

143

1

공지

0

173

1