묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
concat을 통한 데이터프레임 합치기
# result를 list로 만들고 concat을 통해 DataFrame으로 만듭니다.# concat으로 데이터프레임을 합쳐줄때는 리스트 형태로 각 데이터프레임을 넣어주어야 합니다.pd.concat(result.tolist()) --------------------------------------------------------InvalidIndexError: Reindexing only valid with uniquely valued Index objectsdf_item = pd.concat(item_info, ignore_index=True)도 해보았고, 중복값도 없다고 나오는데 계속 이 부분에서 동일한 에러가 뜹니다.. 어떻게 해결해야 할까요? 이 앞부분까지는 모두 정상출력되었습니다!
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
반복문 38번 질문있습니다.
- 본 강의 영상 학습 관련 문의에 대해 답변을 드립니다. (어떤 챕터 몇분 몇초를 꼭 기재부탁드립니다)- 이외의 문의등은 평생강의이므로 양해를 부탁드립니다- 현업과 병행하는 관계로 주말/휴가 제외 최대한 3일내로 답변을 드리려 노력하고 있습니다- 잠깐! 인프런 서비스 운영(다운로드 방법포함) 관련 문의는 1:1 문의하기를 이용해주세요. 리스트변수에서 음수 데이터를 삭제하고 양수만 가지는 리스트 변수를 출력하는 문제입니다.저는 답변을 : num_list=[0,-11,31,22,-11,33,-44,-55]for num in num_list: if num<0: num_list.remove(num)print(num_list)이렇게 작성하였는데 출력값이 [0, 31, 22, 33, -55]이렇게 나오더라구요 ㅠㅠ 마지막에 -55는 왜 들어가버린거죠..?
-
미해결파이썬 셀레니움 고급편 (python selenium - 크롤링, 크롤러)
1강에서 localhost:4000 접속
1강에서http://localhost:4000 연결은윈도우 자체에서 4000번 포트를 열어서 연결하는건가요?설명없이 갑자기 4000번 포트로 연결하니 따라가기가 어렵습니다.
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 기본편
네이버 쇼핑에 팝업창이 뜨기 시작했어요 도와주세요 ㅠㅠ
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 선생님하기 이미지처럼 그저께부터 팝업이 뜨기 시작해 검색창 클릭이 단계로 안넘어갑니다 ㅠㅠ배운 내용대로 코드를 한번 만들어보았는데 작동이 되질 않내요 ㅠㅠ다른 방법이 있을까요...?browser.find_element(By.CSS_SELECTOR,"._searchInput_search_input_QXUFf").click()
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 기본편
셀레니움 실습 시 창이 자동 차단되면서 꺼집니다.
안녕하세요~ 셀레니움 강의를 따라가던 중,네이버 창을 열고 브라우저 꺼짐 방지시켜주는 코드까지 입력을 하고 실행했는데네이버 창이 떴다가 곧 '주의 요함' 이라고 뜨는 Chrome 창으로 전환이 되어 버립니다.위에 팝업으로 'Chrome이 자동화된 테스트 소프트웨어에 의해 제어되고 있습니다' 라고도 떠 있습니다.해결 방안이 있을까요?
-
해결됨[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
연예뉴스크롤링의 CSS연산자 적용 및 no attribute 'text' 해결 방법
안녕하십니까, 강사님. 강의 잘 듣고 있습니다.<연예뉴스크롤링>에서 뉴스 불러오기가 안돼 질문드립니다. 이렇게 코드를 작성했습니다. import requestsfrom bs4 import BeautifulSoupimport timeresponse = requests.get("https://entertain.naver.com/ranking/read?oid=076&aid=0004129264")html = response.textsoup = BeautifulSoup(html, 'html.parser')articles = soup.select("div.info_group")for article in articles:links = article.select("a.info")if len(links) >= 2:url = links[1].attrs['href']response = requests.get(url, headers={'User-agent':'Mozila/5.0'})html = response.textsoup = BeautifulSoup(html, 'html.parser') if "entertain" in response.url:title = soup.select_one(".end_tit")content = soup.select_one("#articeBody")else:title = soup.select_one("#articleTitle")content = soup.select_one("#newsct_article") print(content.text) 이렇게 하면 이런 표시만 나옵니다.C:\스타트코딩_크롤링>C:/Users/Sedaily/AppData/Local/Microsoft/WindowsApps/python3.11.exe c:/스타트코딩_크롤링/03_연예뉴스크롤링하기.py 그래서 else:title = soup.select_one("#articleTitle") 의 CSS 연산자를 #news_tit로 바꿔서 else:title = soup.select_one("#news_tit")이렇게 하니 불러오기는 됩니다.[1번 질문] 강의 마지막 부분에 ID 값이기 때문에 앞의 # 을 . 으로 변경하라고 알려주셨는데 그렇게 하면 안됩니다. html이 강의 당시와 변경돼 그런 건지, 이유가 궁금합니다. [2번 질문] 마지막 부분의 print(content.text) 대신링크, 제목, 본문 정리해서 가져오는 코드로 알려주신 이 코드를 밑에 붙이면print("=======링크=======\n", url)print("=======제목=======\n", title.text)print("=======본문=======\n", content.text) 이렇게 표시가 됩니다. 해결 방법 알려주시면 감사하겠습니다. =======링크=======https://n.news.naver.com/mnews/article/003/0012480442?sid=101Traceback (most recent call last):File "c:\스타트코딩_크롤링\03_연예뉴스크롤링하기.py", line 26, in <module>print("=======제목=======\n", title.text)^^^^^^^^^^AttributeError: 'NoneType' object has no attribute 'text'
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
이 다음 강의도 준비가 되어 있을까요??
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 크롤링 관련해서 이 다음 클래스도 준비되어 있을까요??도움많이 받고 있어 조금 더 고급 스킬 배우고 싶습니다.
-
미해결내 업무를 대신 할 파이썬(Python) 웹크롤링 & 자동화 (feat. 주식, 부동산 데이터 / 인스타그램)
부동산 KB 시세 크롤링 문의
kb시세를 크롤링하는 부분에서 같은평형대가 존재하면 마지막에 있는 평형대의 시세를 가져오는것 같습니다.예를들어 해당단지에 117A 타입과 117B타입이 있습니다.아파트의경우 A타입의 거래는 많지만 B타입은 거래가 없습니다.그래서 A타입의 시세를 조회해야하는데 코드 특성상 같은평형이라면 마지막에 수행한 시세정보를 가져오게 되어있습니다. B타입의 시세를 가져오게 되면 현 시세와 맞지 않는 부분이있습니다. 같은평형대가 있다면 A타입의 시세를 가져오는 코드가 궁금합니다. #kb시세 series_list = [] for _, row in final_complex_detail_df.iterrows(): complex_num = row['complexNo'] area_num = row['pyeongNo'] url = "https://new.land.naver.com/api/complexes/{}/prices?complexNo={}&tradeType=A1&year=5&priceChartChange=false&type=table&areaNo={}&provider=kbstar".format( complex_num, complex_num, area_num ) res = requests.get(url, headers=headers) data_dict = res.json() try: series = pd.DataFrame(data_dict['marketPrices']).iloc[0] series['complexNo'] = complex_num series['pyeongNo'] = area_num series_list.append(series) except: continue time.sleep(0.03) price_df = pd.concat(series_list, axis=1).T
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
Exercise 22. 문자열 다루기 (strip) 문의
code = ' 000660\n abc'print (code)print (code.strip(' \n')) 결과 000660 abc 000660 abc로 \n 이 제거가 되지 않고 줄 바꿈 되었습니다.잘못 코딩한 부분이 어디인지 문의 드립니다.
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 기본편
낮은 가격순을 클릭하는 문을 추가하고싶습니다.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 상품 검색 후 '낮은 가격순'을 클릭하고 수집하고싶습니다.
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 기본편
pip는 내부 또는 외부명령 ,실행할 수 있는 프로그램
pip는 내부 또는 외부명령 ,실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다. 라고 나옵니다. 그래서 인터넷에서 떠돌아다니는 걸 아래와 같이 해서 해봐도 되지 않습니다. 환경변수 설정이 되어 있습니다. 동시에 위처럼 오류가 나는데요. pip를 실행할수가없습니다. 도와주세요. ㅠ.ㅠ
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
이미지 수집이 28번 이후로 이미지가 안떠요
스크롤도 잘내려가다가 갑자기 안되는경우도 잇습니다 ㅜㅜ 왜그런걸까요ㅜ
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
5번 문제 댓글이 보이지 않습니다..ㅠ
https://davelee-fun.github.io/trial/board/news/18129892%EF%B9%96od=T31&po=0&category=0&groupCd=.html 회원가입을 해야지만 댓글을 읽을 수 있다고 합니다..ㅠ 댓글[1]새로운 댓글 확인하기 단축기 'R' 만 보이는 이유가 무엇일까요..
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
혹시 해당 영상 저 수업자료 새로 올려 주신건가요?
하루에 서 너번 해당 영상 업데이트 혹은 해당 공공 데이터 파일만 공유 부탁에 대한 답장만 기다리구 있는데 혹시나 해서 들어가보니 수업 자료가 보이네요..? 차주에 업데이트 해주신 다는 말 외에 아직 답장이 없으신거 보니 맞겠죠..?
-
해결됨파이썬으로 나만의 블로그 자동화 프로그램 만들기
예제로 알려주시는 파일 어디서 다운받나요?
예제로 알려주시는 파일 어디서 다운받나요?
-
미해결실습으로 끝장내는 웹 크롤링과 웹 페이지 자동화 & 실전 활용
네이버쇼핑 크롤링 문의
안녕하세요, 금일 "섹션 15. 네이버 쇼핑 크롤링 + 챗GPT(openai API)" 수강 중에 네이버쇼핑 크롤링이 제대로 되지 않아 질문 드립니다. 강의 그대로 BeautifulSoup만을 이용하여 크롤링을 해보니이상하게 제품을 1개밖에 못 가져오는 현상이 있어서Selenium을 이용하여 크롤링 해보았으나 결과는 같았습니다. 개발자 도구 말고 '페이지 소스 보기' 로 확인해 보았더니 첫 번째 제품을 제외하고는 모두 json 형태의 소스로 바뀌어 있었습니다.이런 경우에는 어떻게 크롤링 해야 하나요?답변 부탁드립니다.감사합니다.
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
마지막 페이지 관련
안녕하세요~! 몇가지 궁금증이 있어 문의 드립니다! 네이버 뉴스 기사가 페이지 넘버링이 아닌, 스크롤식으로 변경된 것으로 확인됩니다. 이러한 경우에는 마지막 기를 어떻게 확인할 수 있을까요? (굳이 마지막 페이지를 확인할 이유가 없을 것 같긴 하지만ㅎㅎ 그래도 궁금하네요 ) 2.f'https://search.naver.com/search.naver?ssc=tab.news.all&where=news&sm=tab_jum&query={keyword}&start={i}' 이전 강의에서 확인하였던, &start={i}을 추가하여 네이버 뉴스 기사 결과를 수집해본 결과, 계속해서 수집이 되긴 했습니다.제 생각에는 연관도가 높은순 → 낮은순으로 출력되는 것 같은데 맞는지도 궁금하네용ㅎㅎ
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
input() , print() 와 대화형 AI ( ChatGPT 혹은 Claude)
- 본 강의 영상 학습 관련 문의에 대해 답변을 드립니다. (어떤 챕터 몇분 몇초를 꼭 기재부탁드립니다)- 이외의 문의등은 평생강의이므로 양해를 부탁드립니다- 현업과 병행하는 관계로 주말/휴가 제외 최대한 3일내로 답변을 드리려 노력하고 있습니다- 잠깐! 인프런 서비스 운영(다운로드 방법포함) 관련 문의는 1:1 문의하기를 이용해주세요. 이번 강의에서 말씀해주신 입출력 방식을 연습해보면서input() 과 print() 를 같이 사용하니 뭔가 '대화' 를 하는 느낌이 강하게 듭니다. ChatGPT 나 Claude 같이 대화형 AI 시스템이 해당 기능에서 복잡하게 확장된 영역이라고 이해해도 되는 건가요?비전공자에 컴퓨터 언어, 프로그램의 배경 지식 거의 없이 강의를 듣다 보니 단순한 입출력 기능에서도 많은 것들이 신기하고 궁금하네요 ㅎㅎ
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
공공 데이터 목록 -> 한국환경공단_대기오염정보 이름 변경 문의
오픈 API에 한국환경공단_에어코리아_대기오염정보 은 찾았는데 영상처럼 한국환경공단_대기오염정보는 보이지 않네요..ㅠ시도별 실시간 측정정보 조회도 검색이 안되고 혹시 영상 파일을 공유해 주실 수 있나요? https://www.data.go.kr/data/15073861/openapi.do
-
해결됨파이썬으로 나만의 블로그 자동화 프로그램 만들기
제가 129 버전인데 드리아버에는 128 버전까지밖에 없는데 다운그레이드 해야하나요?
제가 129 버전인데 드리아버에는 128 버전까지밖에 없는데 다운그레이드 해야하나요?