• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 엔지니어링

  • 해결 여부

    미해결

크롤링에서 크롤링 하기에서 'href' 호출 문의

20.09.13 10:56 작성 조회수 111

0

안녕하세요 질문이 있어서 글을 올립니다

크롤링 하고 다시 크롤링 하는 부분에서 

href 부분이 a href = "ncas/analysis-reports/ar20" 이부분만 나타나서 https://us-cert.cisa.gov/ 생략..

res_info = requests.get(title['href']) 시  https:// 포맷에 안맞다고 오류가 납니다.

이럴떄 해결 방법이 있나요??

답변 1

답변을 작성해보세요.

0

안녕하세요.

우선 각자 원하시는 코드를 작성할 때의 이슈들에 대해서는 양해를 부탁드립니다. 공지사항으로 이유에 대해 상세히 아래와 같이 적어드렸습니다.

간단하게는 만약에 title['href']가 ncas/analysis-reports/ar20 라면, res_info = requests.get("https://us-cert.cisa.gov/" + title['href']) 이런식으로 작성해도 좋을 것 같습니다.

감사합니다.

------------------

오늘은 한가지 공지를 드려요~~

그동안 정말 다양하고 많은 분들께서 수강을 해주고 계시는데요. 그러다보니, 질문/답변 란에 동일한 이야기를 드릴 때가 많아서 공유를 드려요.

질문/답변 란에, 각자 원하시는 크롤링 코드 관련 문의를 해주시는 경우가 꽤 있었는데요. 그 때마다, 가급적 배려를 드리는 차원으로, 가볍게 볼 수 있는 부분에 대해서만 답변을 드리기는 했습니다. 하지만, 해당 질문/답변 란은 본 강의 영상과 관련한 질문이 있을 때를 답변해드리는 것이 기본 취지인 것 같아요. 

온라인 수학 강의를 수강하면서, 강의에 나온 수학공식을 사용하는 강의 외에 각자 풀고 있는 수학 문제를 질문하고, 이를 풀어드리는 강의는 본 적이 없는데요. 마찬가지로 본 강의를 수강하시면서, 각자의 코드나, 각자 원하시는 크롤링 코드를 작성해드리거나, 함께 풀어나가는 것은 현실적으로 큰 무리가 있습니다.

더군다나 본 강의가 평생 수강이 가능하기 때문에, 이를 지원해드릴 경우, 본 강의를 들으면 내가 원하는 크롤링 코드는 모두 해결해드려야 하는 오해 아닌 오해도 생길 수 있고요. 심지어, 저도 실제 코드를 작성해봐야 해서, 코드를 작성하느라 답변이 늦어지면, 다른 답변이 늦어질 수도 있어서, 다른 수강생분들께도 문제가 될 수 있을 것 같습니다.

그래서, 질문/답변란에 문의를 주실 때에는 각자의 원하시는 크롤링 코드 관련 문의는 안해주시면 감사하겠습니다. 이 부분 꼭 양해를 부탁드립니다.