66,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
anaconda navigator
anaconda navigator 창이 아예 열리지 않습니다... 해결 방법이 있을까요..?
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
기업에서도 아나콘다, 파이썬 등을 라이센스 걱정없이 쓸수 있나요?
라이센스 비용이 발생하는지 검색해도 나오질 않아 질문드립니다 ㅠ
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
크롤링해서 엑셀파일로 데이터저장하기1, 에러확인요청
선생님과 똑같이 했는데 뭐가 잘못되었을까요? import openpyxl excel_file = openpyxl.Workbook() excel_sheet = excel_file.active excel_sheet.append(['data1', 'data2', 'data3']) excel_file.save('tmp.xlsx') excel_file.close() NameError Traceback (most recent call last) <ipython-input-2-ceee3ced2775> in <module> ----> 1 excel_file.close() NameError: name 'excel_file' is not defined
- 해결됨파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
재미있게 공부중입니다 여러페이지 한번에 크롤링중
재미있게 보면서 익히고 있습니다 여러페이지를 크롤링할때 url뒤쪽에 0~10까지 붙여서 링크를 하는건 알겠는데요 2페이지 3페이지 넘길때 url주소는 그대로 인경우가 있거든요 이럴때는 어떻게 해야하나요 예를 들어서 제가 지역별 매물을 크롤링하고 싶은데요 https://onland.kbstar.com/quics?page=C059652 서울시 무슨동를 검색해서 들어가도 주소는 변화가 없어서 당황스럽습니다 ㅎ 잘 부탁드립니다 감사합니다
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
#의 여부에 따라 크롤링 성공 여부??
안녕하세요~ 선생님의 명강의를 들으며 감사함에 매일 눈물 흘리는 대학생입니다 ㅠㅠ 교수님의 넘치는 사랑으로 더 넘쳐버린 과제들에 치여서 과제에 머리가 터질 것 같았는데,, 잔코 영상 정주행하면서 과제 제작시간이 절반으로 줄어든 것 같아요. 서두가 길었네요! 궁금한 부분이 있습니다. 강의제목 : "바로 실전 크롤링해보기: 네이버 주식 사이트 크롤링하기" 강의시간 : 3분 34초 쯤 질문 내용 : 제가 첨부한 사진에서, 보라색 원으로 두 곳을 칠해두었습니다. 위의 원은 #을 넣어야만 아웃풋이 나오고, 아래의 원은 #을 빼야만 아웃풋이 나오더라구요. 반대로 위의 원에서 #을 빼고 아래 원에 #을 넣으면 아웃풋이 안나옵니다. 이유가 무엇일까요?? 바쁘시겠지만 알려주시면 정말 감사하겠습니다 =)) 과제에 치여서 죽어가는 저를 살려주셔서 다시 한 번 감사합니다.. 방학 되면 잔코의 다른 강의들도 다 들을게요!~! 첫 원의 코드 from bs4 import BeautifulSoup import requests res = requests.get('https://finance.naver.com/') soup=BeautifulSoup(res.content, 'html.parser') data = soup.select('#_topItems1 > tr > th > a') for item in data: print(item.get_text()) 두번째 원의 코드 from bs4 import BeautifulSoup import requests res = requests.get('https://finance.naver.com/') soup=BeautifulSoup(res.content, 'html.parser') data = soup.select('div.aside_area.aside_stock > table > tbody > tr> th > a') for item in data: print(item.get_text())
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
marriage에 왜 false를 쓰고싶으신가요?
??
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
지마켓 크롤링 시 select와 select_one 구분
선생님 안녕하세요 너무 유익한 강의로 많이 배우고 있습니다. 감사합니다. 10분 20초에 나오는 gmarket 크롤링하는 부분에 대해서 궁금증이 있어 문의드립니다. 선생님 답안을 보기 전에 저는 bestlists=soup.select('div.best-list') bestitems=bestlists[1] products=bestitems.select('ul > li') for index, item in enumerate(products): title=item.select('a.itemname') price=item.select('div.s-price > strong') print(index+1, title.get_text(), price.get_text()) 이렇게 for문 안에서 ul>li로 상품하나를 뽑은 상태니까 a태그에 itemname은 하나뿐이기 때문에 select_one 대신에 select를 사용하였는데 get_text()했을때 오류가 뜹니다. 하나뿐이니까 select로 해도 나와야되는게 아닐지..궁금합니다! 너무 좋은 강의 감사합니다.
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
아나콘다 설치 과정에서 질문 드립니다.
안녕하세요 선생님! 아나콘다 파일을 다운받은 후 다운받은 파일을 클릭해서 설치 하려고 저장장소를 지정 하는 과정에서 이런 에러 창이 뜨면서 설치가 안되고 있습니다. 제가 파이썬 설치를 안하고 아나콘다를 설치해서 그런건가요? 제 컴퓨터 시스템 정보에 들어가서 64비트인 것을 확인하고 설치했습니다. + 파이썬 설치를 했는데도 계속해서 에러창이 뜨고 있네요.. 저장 장소를 바꾸어도 계속 이렇게 뜨고 있습니다..
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
뉴스 크롤링 코드 관련 문의합니다.
크롤링하기 수업을 듣는 중에 크롤링을 하는 과정에서 import requests from bs4 import BeautifulSoup res=requests.get('http://www.hani.co.kr/arti/society/health/965832.html') soup=BeautifulSoup(res.content,'html.parser') data=soup.find('h4') data.get_text() 결과가 \n\n코로나19 신규 확진자 110명…요양병원 집단감염 영향\n\n' 글자 옆에 돈표시같은게 같이 나와서 import requests from bs4 import BeautifulSoup res=requests.get('http://www.hani.co.kr/arti/society/health/965832.html') soup=BeautifulSoup(res.content,'html.parser') data=soup.find('span', 'title') data.get_text() 하니까 '코로나19 신규 확진자 110명…요양병원 집단감염 영향' 으로 나오는데요. h4와 span의 차이가 궁금합니다. 크롤링한 뉴스 html이미지로 첨부합니다. 크롤링한 뉴스url입니다. http://www.hani.co.kr/arti/society/health/965832.html 그리고 뉴스의 텍스트 추출하는 과정에서 import requests from bs4 import BeautifulSoup res=requests.get('http://www.hani.co.kr/arti/society/health/965832.html') soup=BeautifulSoup(res.content,'html.parser') mydata=soup.find('div', 'text') mydata.get_text() 이렇게 했는데 아무것도 안뜹니다. 왜 아무것도 안뜰까요? 오류메시지도 안뜨고 아무것도 안떠요
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
get_text()와 string의 차이
안녕하세요! "패턴으로 실습하며 익히기:HTML 이해를 바탕으로 크롤링하기" 해당 강의 영상 16:05에서 find_all 함수 사용하기를 보면 print(paragraph.get_text())가 사용됬는데요, print(paragraph.string)과 무슨차이가 있나요?
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
질문 있습니다!
from googletrans import Translator dave=Translator() word=dave.translate('안녕하세요',dest='en',src='ko') print(word.text) #결과표 Python 3.8.1 (v3.8.1:1b293b6006, Dec 18 2019, 14:08:53) [Clang 6.0 (clang-600.0.57)] on darwin Type "help", "copyright", "credits" or "license()" for more information. >>> == RESTART: /Users/parkminyoung/Desktop/PROGRAMMING/인프런/practice_idle.py == Traceback (most recent call last): File "/Users/parkminyoung/Desktop/PROGRAMMING/인프런/practice_idle.py", line 1, in <module> from googletrans import Translator ModuleNotFoundError: No module named 'googletrans' 터미널에서 googletrans 분명 설치됐다고 sucess도 뜨는데, 왜 아이들 환경에서 계속 모듈을ㄹ 찾을 수 없다고 뜰까요,,,?ㅜㅠ 재시동 했는데도 여전히 같은 결과입니다 ㅜㅠ(맥환경)
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
CSS selector 사용해서 그롤링하기(2020 업데이트) 관련 질문입니다.
안녕하세요, 선생님. 어렵지만..잘 설명해주시는 덕분에 강의 잘 듣고 있습니다 :) 다름 아니라 CSS selector 사용해서 그롤링하기(2020 업데이트) 에 올려주신 자료에 질문이 있습니다. 13페이지에서 다음 경제란에서 경제 주요 뉴스 타이틀 가져오기를 해보는데 결과 값이 나오지 않습니다. 제가 작성한 코드는 아래와 같습니다. import requests from bs4 import BeautifulSoup res = requests.get('https://news.daum.net/economic/') soup = BeautifulSoup(res.content, 'html.parser') data = soup.select('#mArticle > div > ul > li > strong > a') for i in data : print(i.get_text()) 바쁘시겠지만 확인 한 번 부탁드리겠습니다! 감사합니다 :)
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
52번 문제에 관한 질문
tupledata = ('fun-coding1', 'fun-coding2', 'fun-coding3', 'fun-coding4', 'fun-coding5') print(tupledata[1:6]) ('fun-coding2', 'fun-coding3', 'fun-coding4', 'fun-coding5')튜플 그대로 실행해도 이렇게 실행값이 제대로 나옵니다. 근데 선생님께서 튜플은 리스트처럼 변환하거나 이런게 안된다고 하셨는데 이렇게 인덱스를 적용하는 것이 가능한가요?
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
강의 잘듣고있습니다 강사님!
이제 코스1.파이썬과 크롤링 부트캠프 강좌가거의 끝나가네요!! 강사님이 잘 가르쳐주신 덕분에 크롤링에 재미를 들였습니다! 저는 지금 데이터과학 코스를 밟아보려 하는데 11월 말에 있는 Sqld시험을 보려하고 있습니다. 혹시 코스2.selenium부분을 잠시 스킵하고 sqld공부와 강사님의 코스3.sql강의를 함께 병행하려 하는데 커리큘럼상에서 selenium을 건너뛰고 sql수강한 후에 selenium을 수강해도 되는지 궁금합니다! 항상 감사합니다(수강평에도 똑같은 질문을 올렸는데 수정을 어떻게 하는지 모르겠네요 ㅠ)
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
하이퍼링크 관련 질문 드립니다
안녕하세요~ <크롤링과 엑셀 파일까지 한번에 프로그램 만들기> 강의 수강 중 하이퍼링크 관련 질문이 있습니다. 엑셀 파일을 생성하는 함수를 정의하여 코드를 작성해보았는데, 하이퍼링크 생성 코드 작성 시, 데이터가 없는 엑셀 파일이 생성되었습니다. (아래 코드 참조) 그래서 하이퍼링크 코드가 제가 정의한 함수가 아닌, 크롤링 코드 내 (for 문) 에 있어야 할 것 같다고 생각했는데.. 그러면 excel_sheet 가 정의되지 않았다는 에러가 납니다. (아래 이미지 참조)하이퍼링크 생성 코드는 어디에 작성되어야 할까요? # 엑셀 파일 생성 함수 정의 import openpyxl def write_excel_template(filename, sheetname, listdata): excel_file = openpyxl.Workbook() excel_sheet = excel_file.active excel_sheet.column_dimensions["B"].width = 60 excel_sheet.column_dimensions["C"].width = 70 # (다음 코드를 추가하였습니다) 하이퍼링크 생성 코드 excel_sheet.cell(row=index+1, column=3).hyperlink = title['href'] excel_sheet.title = sheetname for item in listdata: excel_sheet.append(item) excel_file.save(filename) excel_file.close() # 크롤링 코드 import requests from bs4 import BeautifulSoup res = requests.get("http://corners.gmarket.co.kr/Bestsellers?viewType=G&groupCode=G06") soup = BeautifulSoup(res.content, "html.parser") product_lists = list() bestlists = soup.select("div.best-list") bestitems = bestlists[1] products = bestitems.select("ul > li") for index, product in enumerate (products): title = product.select_one("a.itemname") price = product.select_one("div.s-price > strong") res_2 = requests.get(title['href']) soup_2 = BeautifulSoup(res_2.content, "html.parser") provider = soup_2.select_one("div.item-topinfowrap > div.item-topinfo > div.item-topinfo_headline > p > a > strong") product_info = [index+1, title.get_text(),title['href'], price.get_text(), provider.get_text()] product_lists.append (product_info) # 함수 호출 write_excel_template("report.xlsx","베스트상품", product_lists)
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
여러 사이트에서 한번에 크롤링
안녕하세요 선생님, site_list =[ 'A사이트' , 'B사이트' ] 같이 여러 웹페이지를 한번에 불러오는 법을 가르쳐 주셧는데요, 문득 든 궁금점이 추가한 각각의 홈페이지에서 추출하려는 데이터가 각기 다른 CSS select 구문을 필요로 하면 어떻게 해야하는건가요? 일단 data = soup.select ('#productListArea > ul > li > p >a' , '#main > div > section > div > div') 이런식으로 콤마 뒤에 추가해보았는데 적용이 되지 않습니다. 질문이 정확하지 않은 것 같아 말씀드리자면 제가 시도했던 것은 A 일보 헤드라인, B 일보 헤드라인, C 일보 헤드라인을 추출해서 한번에 보여주는 기능을 만드는 것이었습니다. 감사합니다.
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
아이들 환경
강사님, 아이들 환경으로 수업을 들어도 될까요? 평소에 익숙해져있던 툴이라 아이들이 좀 더 편해서요. 혹시 주피터로 꼭 강의를 들어야 할 이유가 있다면, 더 편해서인가요? 강사님들은 주피터를 많이 사용하시더라고요.
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
Gmarket 크롤링 실습문제
안녕하세요, 강의를 잘 따라오면서 열심히 공부하고 있는 수강생입니다. gmarket 베스트 상품 크롤링 실습을 따라하면서 아래와 같은 오류가 나서 질문드립니다. 크롤링한 데이터 다시 크롤링하기 강의 中 2020.09.23일 기준 20번째 title,price,provider_info를 불러올 때 None값이 나타납니다. 코드의 오류일까요 g마켓의 html구조의 문제일까요 답변부탁드립니다.
- 미해결파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
Exercise 17. 조건문 문제 질문이요
강사님 답과 비슷하게 하였으나 에러요소가 있는지 확인 받고 싶어서 질문 드려요.
- 해결됨파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
웹사이트에서 크롤러의 행동을 규제하는 robots.txt에 관해 질문드립니다.
안녕하십니까 선생님. 강의에서 다뤄주신 크롤링 기법을 사용해 제 개인 프로젝트에 활용하려고 하는 통계학과 대학원생입니다. 강의 외적인 질문이라 죄송스러운 마음이 앞서지만, 선생님같은 식견을 가지신 분이시라면 답을 알고 계실 것 같아 양해를 부탁드리며 질문 올리겠습니다. 보다 구체적으로, Daum뉴스에서 크롤링한 기사들의 원문을 데이터로 사용하는 모델을 만들어 이를 적용하고 그 결과를 제 깃헙 페이지에 공개하려고 했습니다. 하지만 프로젝트를 진행하는 과정에서 robots.txt의 존재를 알게 되었고, 실제로 news.daum.net/robots.txt를 확인해 봤을 때 해당 사이트에서 모든 크롤링 시도를 금지하고 있음을 확인할 수 있었습니다(User-agent: * Disallow : /). 저는 악의나 영리 목적의 의도가 없고, 심지어는 request와 request 사이에 지연을 줘서 서버에 무리가 가지 않도록 할 의향도 있습니다. 그럼에도 불구하고 robots.txt에 저렇게 지정되어 있으면 어떤 방식으로든 크롤링을 금지하며 이를 어길 시 어떤 방식으로든 책임을 물을 수 있다는 의미인지 궁금합니다. 마지막으로, 좋은 강의 항상 너무 감사하다는 말씀 드리고 싶습니다. 파이썬 기초는 이미 알고 있어서 사실 크롤링 부분만을 위해 강의를 수강하긴 했습니다만, 모든 내용을 잘 이해할 수 있었습니다. 이에 더해 파이썬 중급 강의도 거의 마쳐가는데, decorator나 generator의 원리를 확실히 알게된 것 같아 너무 유익하고 좋았습니다. 둘 다 곧 마무리하고 수강평 남기도록 하겠습니다! 이상입니다. 감사합니다.