inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

BeautifulSoup 사용법 및 간단 웹 파싱 기초(2)

2-6-2_new 질문

187

kwonokun

작성한 질문수 4

0

아래와 같이 복사 해서 실행하였는데

결과는 에러가 나옵니다. 도와 주세요..

< html >

< body >

< div id = " foods " >

< h1 > 안주 및 주류

< ul id = " fd-list " >

< li class = " food hot " data-lo = " ko " > 닭 도리탕

< li class = " food " data-lo = " jp " > 돈까스

< li class = " food hot " data-lo = " ko " > 삼겹살

< li class = " food " data-lo = " us " > 스테이크

< ul id = " ac-list " >

< li class = " alcohol " data-lo = " ko " > 소주

< li class = " alcohol " data-lo = " us " > 맥주

< li class = " alcohol " data-lo = " ko " > 막걸리

< li class = " alcohol high " data-lo = " cn " > 양주

< li class = " alcohol " data-lo = " ko " > 동동주

Traceback (most recent call last):

File "/Users/Apple/section2/download2-6-2.py", line 14, in

print("1", soup.select("li:nth-of-type(4)")[1].string) #각 li 태그 그룹의 4번째 요소 선택

IndexError: list index out of range

[Finished in 0.659s]

첨부 파일 복사본

from bs4 import BeautifulSoup

import sys

import io

sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding = 'utf-8')

sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding = 'utf-8')

fp = open("food-list.html",encoding="utf-8")

soup = BeautifulSoup(fp, "html.parser")

print(soup)

print("1", soup.select("li:nth-of-type(4)")[1].string) #각 li 태그 그룹의 4번째 요소 선택

print("2", soup.select_one("#ac-list > li:nth-of-type(4)").string)

print("3", soup.select("#ac-list > li[data-lo='cn']")[0].string)

print("4", soup.select("#ac-list > li.alcohol.high")[0].string)

param = {"data-lo": "cn", "class": "alcohol"}

print("5", soup.find("li", param).string)

print("6", soup.find(id="ac-list").find("li",param).string)

for ac in soup.find_all("li"):

if ac['data-lo'] == 'us':

print('data-lo == us', ac.string)

웹-크롤링 python

답변 1

0

좋은사람

안녕하세요. 오근님

해당 2-6-2는 오류가 나는 것이 맞습니다.

https://github.com/eunki7/python_create_app_1/blob/master/section2/2-6-2_new_1.py

수정 후 새로운 파일을 업로드 한 상태입니다.

링크 가셔서 확인하시면 실행됩니다.

감사합니다.

현재 예제에서 error 발생

0

367

3

유튜브 동영상 다운로드

0

1448

2

Atom 에디터 관련

0

337

1

위시켓 폼데이터

0

274

1

스케줄러 사용 관련 질문 드립니다

0

627

1

selenium 에러

0

428

1

Progress bar 쓰레드 관련

0

489

1

Install Package 관련 문의

0

328

1

tkinter 샘플 코드 실행 오류 건

0

1267

1

4-7-6 네이버 & 카카오 주식 정보 가져오기

0

381

1

네이버자동로그인_by_selenium

0

876

1

위시캣 로그인 처리 및 크롤링 질문

0

345

1

2-8-1 네이버이미지 크롤링 질문

1

604

3

li:nth-of-type 질문

0

350

2

에러가 뜨는데 잘 모르겠어요ㅠ

0

401

2

Install Packages 항목이 안보이는 이유가 뭘까요?

0

401

2

환경변수 Path 설정 방법

0

631

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) - 인프런

0

333

1

웹 브라우저 없는 스크랩핑 및 파싱 실습(1) -git주소

0

477

3

download2-8-1. py질문

0

203

1

ip 차단 당하는 거 같은데 아무리 랜덤주고, sleep 줘도 안 되는데 다른 방법 더 있을까요??

0

645

1

인프런 환경이 바뀌어서 제나름대로 하는데

0

196

1

다시올려주신 예제파일로하는데

0

190

1

아직도 에러가뜨나보네요?

0

584

1