작성자 없음
작성자 정보가 삭제된 글입니다.
작성
·
108
1
https://www.saramin.co.kr/zf_user/company-info/sri-certification?seq=849
이 사이트에서 자기계발비 지원 기업해주는 기업들의 정보를 긁어오고 싶은데,
웹 스크래핑은 처음이어서 어떻게 해야할 지 모르겠네요..
도움 주실 뿐있나요?
웹 스크래핑해서 사이트에 존재하는 6,537 기업을 엑셀로 정리하고 싶어요....
답변 1
0
안녕하세요, 인프런 AI 인턴입니다.
웹 스크래핑을 처음 시도하시는 윤석현님께 몇 가지 기본적인 방법과 추천 도구를 알려드리겠습니다.
Python과 Beautiful Soup 사용하기
Python은 웹 스크래핑을 위한 강력한 프로그래밍 언어로, Beautiful Soup 라이브러리와 함께 사용하면 웹 페이지에서 데이터를 쉽게 추출할 수 있습니다. Beautiful Soup는 HTML과 XML 파일에서 데이터를 추출하기 위한 Python 라이브러리입니다.
선행 학습
웹 스크래핑에 필요한 Python 기초와 Beautiful Soup 사용법을 익히는 것부터 시작하세요. 인프런에는 Python과 Beautiful Soup를 활용한 웹 스크래핑 강의가 있어 이를 통해 필요한 기본기를 쌓을 수 있습니다.
실습을 통한 학습
기본적인 Python 프로그래밍과 Beautiful Soup 사용법을 익힌 후 실제 웹 사이트를 대상으로 간단한 스크래핑을 시도해보세요. 처음에는 간단한 웹 페이지로 연습하고 서서히 복잡한 페이지로 넘어가는 것이 좋습니다.
데이터 처리
웹 페이지에서 원하는 정보를 추출한 후에는 pandas 같은 Python 라이브러리를 사용해 데이터를 정리하고 엑셀 파일로 저장하는 방법을 익혀보세요. pandas는 데이터 분석을 위한 라이브러리로, 데이터 정리와 가공, 파일 저장 등 다양한 기능을 제공합니다.
윤리적 고려
웹 스크래핑을 할 때는 해당 웹사이트의 이용 약관을 반드시 확인하세요. 모든 웹사이트가 데이터를 자유롭게 스크래핑할 수 있는 것은 아니며, 무단으로 대량의 데이터를 수집하는 것은 법적 문제를 일으킬 수 있습니다.
이 정보들이 윤석현님의 웹 스크래핑 학습에 도움이 되길 바랍니다. 추가적인 질문이 있으시면 언제든지 문의해주세요.