inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Thu thập dữ liệu web và tự động hóa trang web & ứng dụng thực tế hoàn thành với thực hành

Tìm hiểu lớp thông tin sản phẩm và loại bỏ các sản phẩm được quảng cáo

쿠팡 BeautifullSoup 헤더넣어도 막히네요

442

sakuraibbo

6 câu hỏi đã được viết

0

headers = {
    'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36',
    "accept-language": "ko,en-US;q=0.9,en;q=0.8",
    "accept-encoding" : "gzip, deflate, br, zstd",
    "cache-control" : "max-age=0"
}

 

위와 같이 헤더를 넣어도....

타임아웃으로 나오지 않더라구요

이제는 헤더만으로는 못할 거 같은데

셀레니움 외 방법이 없을까요 ㅠㅠ

 

python 웹-크롤링 selenium beautifulsoup

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. sakuraibbo님.

쿠팡과 같은 사이트에서는 단순히 헤더에 User-Agent를 추가하는 것만으로는 웹사이트 접속이 제한될 때가 많습니다. 최근에는 웹사이트에서 다양한 방법으로 봇 탐지를 강화하고 있기 때문에, 이를 우회하기 위해서는 여러 가지 전략을 사용할 필요가 있습니다.

크롤링의 일반적인 전략 중 하나는 헤더 이외의 인증정보 추가입니다. 특히 쿠키나 세션 정보를 추가하면 사이트에서 브라우저처럼 인식할 가능성이 커집니다. 이 경우 쿠키 정보가 중요하기도 하며, 이는 웹 브라우저에서 세션을 통해 직접 얻어올 수 있습니다.

다음은 동일한 주제에 대한 다른 질문과 답변 링크입니다:
1. 똑같이 따라했는데 쿠팡 크롤링이 되질 않습니다 무엇이 문제일까요? - 쿠키와 타임 슬립을 사용하여 문제를 해결하는 방법을 설명합니다.
2. 쿠팡 크롤링에서 쿠키로 해결하는 방법 질문 - 쿠팡 크롤링 중 쿠키 사용의 중요성 및 다양한 해결 방법에 대한 논의입니다.

위의 자료들을 참고하시면, 쿠팡과 같은 사이트에서 크롤링 시 사용할 수 있는 추가적인 방법들을 배울 수 있습니다. 이는 사용자 세션이나 로컬 쿠키를 포함하여 웹 페이지 서버에 브라우저로 나타내는 데 도움을 줍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

멜론 사이트 수집부터 안됩니다

0

56

1

강의 시점이랑 현재랑 네이버 사이트 변화가 많은거 같아서 질문드립니다.

0

54

1

-href 가져오기

0

90

2

수업내용 프로젝트의 완성된 코드는 제공이 안돼나요?

0

155

1

안녕하세요 쿠팡 크롤링 막힌거 같아요 3번돌리니깐 막았어요 해결방법없을까요?

0

3596

1

네이버 쇼핑 크롤링 1 코드 사용 시, 접속 제한됐을 때의 해결 방법이 궁금합니다.

0

3164

1

추가 강의 업데이트 있나요?

0

245

1

lambda 중에 문의가 있습니다.

0

269

1

텔레그램 sendMessage 시 400에러가 뜹니다.

0

898

2

ftp 로긴 문제입니다. ㅜ

0

402

2

네이버 쇼핑 크롤링 질문입니다.

0

366

1

XPATH 네이버에서 카페 찾는 과정 문의입니다.

1

312

1

셀레니움 By.XPATH 를 이용한 키워드 입력 작성 질문입니다.

0

664

2

쿠팡 이미지 파일 다운받기에서 동일하게 코드 작성 후 요청하였지만 파일 다운로드가 안됩니다.

0

805

2

파이썬에 키워드를 치는게 아닌...

0

274

2

50프로 수강중입니다~

0

217

1

제품 링크를 타고 들어가야 원하는 정보가 나오는 사이트

0

378

2

lst = lst50 + lst100 이거 대신에

0

321

2

증권, 메일 등 서비스 목록을 못가져와요 ㅠㅠ

1

279

1

네이버에 view탭이 업데이트가 됐는지 없어졌네요... ㅠㅠ

1

245

1

선생님이랑 똑같이 적었는데 저는 왜 오류가 날까요?ㅠ

0

354

2

네이버쇼핑 크롤링 문의

0

428

2

asyncio.run() cannot be called from a running event loop 에러 질문 드립니다

0

3891

4

멜론 유저에이전트 값 입력했음에도 창접속이안되여 ㅜㅜ

0

247

1