묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
네이버 쇼핑 여러페이지 크롤링 방법
네이버 지식인 여러페이지 정적 크롤링은 강의에 있어서 따라하니 잘 되는데 동적 페이지 크롤링인 네이버 쇼핑은 for i in 코드를 넣으니 넘어가지지가 않네요 ㅜㅜ 동적 페이지 크롤링인 네이버 쇼핑 여러페이지 넘어갈때는 다른 코드를 작성해야하는걸까요? 네이버 지식인 여러페이지 크롤링 할 때처럼 하니 페이지가 안넘어가지네요...
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
페이지가 넘어갈 때 url 변하지 않는 경우
안녕하세요 제공해주신 깃허브 홈페이지 url의 경우는 페이지가 넘어갈 때마다 'url/page{page_num}' 형식으로 변하게 되는데 제가 살펴본 네이버 카페의 경우(링크 아래 첨부)는 페이지 수를 넘겨도 페이지 수가 변하지 않았습니다. 네이버 카페 url: https://cafe.naver.com/cantsb 혹시 이러한 경우 페이지 수에 따른 크롤링을 어떻게 하는지 궁금합니다.
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
자료 한번에 다운
전체 자료를 한번에 다운 받을 순 없나요?????
-
미해결내 업무를 대신 할 파이썬(Python) 웹크롤링 & 자동화 (feat. 주식, 부동산 데이터 / 인스타그램)
requirements.txt 다운로드가 안끝나요
requirements.txt파일을 다운하는데 지금 몇십분째 다운중인 거 같은데 이거 오류인가요??무슨 문제가 있는걸까요
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
웹 크롤링 대상중 웹에디터(smart_editor2) 안의 텍스트를 크롤링하는 방법
수업을 적용하며 크롤링 연습을 하고 있는데, 웹 크롤링 대상중 웹에디(smart_editor2) 안의 텍스트를 크롤링하는 방법이 궁금합니다.셀레니움을 활용하여 적용하고 있는데 웹에디터는 접근이 잘 안되고 접근이 된것 같은데 텍스트가 출력되지 않습니다 어떠헥 해야 할지 모르겠어서 질의 드려요 외부 접근되지 않는 사이트이고 아이디 비번은 마스킹 처리한 코드는 아래와 같습니다. 결국 아래 부분이 문제인것 같은데 에디터 내 텍스트 추출 방법을 몰라 문의드려요 try: driver.switch_to.frame("iframe4dummy") # 🔹 iframe 내부로 이동 # 🔹 iframe 내부에서 특정 클래스("se2_inputarea")를 가진 body 태그 찾기 # 🔹 iframe 내부의 `body` 태그에서 텍스트 가져오기 body = driver.find_element(By.CSS_SELECTOR, "body") answer = body.text.strip() print("✅ HTML 에디터 내용:", answer) # 🔹 다시 원래 페이지로 복귀 driver.switch_to.default_content() except Exception as e: print("❌ iframe 전환 실패 또는 body 태그를 찾을 수 없습니다:", str(e)) from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By from urllib.parse import urlencode # URL 파라미터 추가용 import time import random import openpyxl import requests from bs4 import BeautifulSoup from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC newscralling =[] import pyautogui import pyperclip #크롬 드라이버 자동 업데이트 from webdriver_manager.chrome import ChromeDriverManager # #브라우저 꺼짐 방지 chrome_options = Options() chrome_options.add_experimental_option("detach", True) service = Service(executable_path=ChromeDriverManager().install()) driver = webdriver.Chrome(service = service) # 웹페이지 해당 주소 주소이동 driver.implicitly_wait(2) #웹페이지가 로딩 될때까지 5초 대기 driver.maximize_window() driver.get("https://OOO") #아이디 입력창 id = driver.find_element(By.CSS_SELECTOR, ".submitLogin.text:nth-of-type(1)") id.click() pyperclip.copy("id") pyautogui.hotkey("ctrl", "v") time.sleep(0.3) # id.send_keys(Keys.TAB) # #비밀번호 입력창 직접입력 # time.sleep(7) pw = driver.find_element(By.CSS_SELECTOR, ".login ul li:nth-of-type(2) input") pw.click() # pw.send_keys("비밀번호") pyperclip.copy("pass") pyautogui.hotkey("ctrl", "v") #로그인 버튼 login_btn = driver.find_element(By.CSS_SELECTOR, ".btnLogin") login_btn.click() time.sleep(1) params = { "counselProcStatus": 2, "page": 1, "pageSize": 2 } #SSL인증 비활성화에 대한 경고메시지 삭제 import urllib3 urllib3.disable_warnings() qna_list_url = "https://OOO"+ urlencode(params) driver.get(qna_list_url) html = driver.page_source soup = BeautifulSoup(html, 'html.parser') articles = soup.select(".boardListStyle table tbody tr") import openpyxl from datetime import datetime wb = openpyxl.Workbook() ws = wb.active ws.title = "온라인상담_접수중" ws.append(["date", "category", "title", "quest", "answer", "man", "status"]) crowling = [] for article in articles: title = article.select_one(".alignLeft a").text date = article.select_one(".boardListStyle table tbody td:nth-of-type(4)").text category = article.select_one(".boardListStyle table tbody td:nth-of-type(2)").text status = article.select_one(".boardListStyle table tbody td:nth-of-type(7)").text link = 'https://OOO/'+ article.select_one(".alignLeft a").attrs['href'] title_link = f'=HyPERLINK("{link}", "{title}")' #상세 페이지 요청 driver.get(link) time.sleep(2) # 페이지 로딩 대기 detail_html = driver.page_source detail_soup = BeautifulSoup(detail_html, 'html.parser') quest = detail_soup.select_one(".con_txt").text try: driver.switch_to.frame("iframe4dummy") # 🔹 iframe 내부로 이동 # 🔹 iframe 내부에서 특정 클래스("se2_inputarea")를 가진 body 태그 찾기 # 🔹 iframe 내부의 `body` 태그에서 텍스트 가져오기 body = driver.find_element(By.CSS_SELECTOR, "body") answer = body.text.strip() print("✅ HTML 에디터 내용:", answer) # 🔹 다시 원래 페이지로 복귀 driver.switch_to.default_content() except Exception as e: print("❌ iframe 전환 실패 또는 body 태그를 찾을 수 없습니다:", str(e)) #answer = detail_soup.select_one(".se2_input_area.husky_seditor_editing_area_container iframe").text man = detail_soup.find('th', string="작성자").find_next_sibling().text crowling = ws.append([date, category, title, quest, answer, man, status]) driver.back() # 브라우저에서 '뒤로 가기' 실행 print(date, category, title, quest, answer, man, status) now = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"온라인상담_{now}.xlsx" wb.save(filename)
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
GUI 기초 사용법에서 실행하니 아무것도 안나오네요 ㅜㅜ
스타트코딩님과 같은 코드를 입력했는데 아무것도 안나오네요!login_ui.py 부분까지 변경해서 적용 시키기까지 했는데 기초 사용법에 넘어와서 똑같이 코드 작성했는데도 아무것도 실행이 안되네요 터미널보니 계속 에러가 나네요
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
html 띄어쓰기 되어 있는경우
- html 띄어쓰기 되어 있는경우 아래와 같이 검색키워드"패션 인공지능"이렇게 공백이 있어 띄어쓰기가 되어 있는데 "인공지능"을 없에거나 아니면 html로 포함시키는 방법이 궁금해 질문드려요
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
pyside6 설치 사용법에서
기초사용법 부분 코드 그대로 따라했는데 실행이 안되네요 ㅜㅜ이전에 py파일로 변환한다고 폴더 경로를 06.gui프로그래밍 경로로 했다가 다시 파이썬 크롤링 경로로 설정 한다고 했는데 제대로 안된걸까요? 그래서 실행이 안되는건가 싶어서요! 제가 터미널 설정을 잘 못해서 실행이 안되는건지 궁금합니다!
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
주피터 실행이 안돼요.
하라는거 다 했는데 안돼요..이러면 강의 못듣나요?
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
pyside6 ui파일이 py파일로 변환이 안되네요
파이사이드 설치및 사용법 영상에 나온대로 입력했는데도 컴파일 파일로 변환이 안되네요~프로젝트 폴더를 gui폴더로 하라고 하셔서 클릭 해서 했는데 제대로 설정이 안된걸까요? 두번째 사진 보면 스타트 코딩님이랑 다르게 06.GUI프로그래밍이 안나오네요! 혹시 이걸 제대로 설정 못해서 안되는걸까요? 컴파일 파일로 변환 안되면 vs 코드 재실행하고 파이썬 삭제하고 파이사이드 재설치 하라고 하셔서 했는데도 계속 안되네요 ㅜㅜ
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
문구 print 할때 쌍따옴표랑 따옴표 가 다른가요?
따옴표로 입력할때는 출력이 안되는데, 쌍따옴표로 입력할땐 출력이 잘되어요. 이게 차이가 있는건가요? 저번 수업때는 아무 차이 없다고 배웠는데요
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
무한스크롤을 하면 최상단 상품이 사라지는 경우
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.무한스크롤을 하면 하단에 없던 상품이 동적 로딩 되지만상단 상품들이 사라지는 경우강의에서 처럼 스크롤을 끝까지 내린다음이 아니라스크롤을 조금씩 내리면서 상품을 담아야 할까요?
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
나무태그 수업 진행중인데 아무것도 안나오네요~
2단계 나무태그 찾기 강의 듣고 있는데 5:05 초에작성하고 실행 누르면 내용들이 나와야 하는데 아무것도 위 사진처럼 실행해도 아무것도 안나오는데 이유를 잘 모르겠어서 질문드려요~ 계속 봐도 다르게 친거 같지 않은데 뭔가 바뀐게 있을까요?
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 기본편
크롤링 관련 질문입니다
크롤링을 해서 모은 데이터를 제가 사용하려고 하면 문제 될 수 있는 부분이 있을까요?혹시 어느정도 까지가 괜찮다고 생각하시나요??
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
키워드출력이 이상합니다..
키워드는 강의해주신 것처럼 아래와 같이 처리가 되어 있음에도 불구하고, 결과값이 ['NFT', 'cryptocurrency', 'collateral', 'personal property', 'AI', 'NFT', '물건', '동산', '가상화폐', '인공지능'] 으로 나옵니다. 이유가 뭘까요.. keywords = soup.select_one(".infoDetailL>ul>li:nth-of-type(7)>div").text.split(';') keywords = [keyword.strip() for keyword in keywords]
-
미해결[신규 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
네이버 쇼핑 링크 변경에 따른 실습 문의
안녕하세요 크롤링이 뭔지 아예 모르다가 이게 조금씩 눈을 뜨고 있는 뉴비입니다~! 네이버 쇼핑 홈페이지 변경 및 HTML 구조 변경으로 설명이 한번 더 되면 좋겠습니다 강의에 나온 것처럼 나무태그를 찾으려 해도 현재 기준 네이버 쇼핑 HTML 구조를현재 강의 내용을 기반으로 따라 할 수가 없습니다ㅠㅠ(상위 클래스로 검색해도 안나오는..??) https://search.shopping.naver.com/ns/search?query=%EB%8B%AD%EA%B0%80%EC%8A%B4%EC%82%B4 기회가 된다면 업데이트를.. 안된다면 유투브로 보여주셔도 짤막하게라도 보여주시면 좋을거 같습니다!! 감사합니다~!
-
미해결남박사의 파이썬으로 봇 만들기 with ChatGPT
맛집 검색 네이버 api 403에러 나는데 현재 막혔나요?
https://map.naver.com/p/api/smart-around/places?searchCoord=127.119009%3B37.296806&boundary=127.11741034949176%3B37.289602227353484%3B127.12082211935848%3B37.303838401625484&code=01&limit=20&sortType=RECOMMEND&timeCode=EVENING 접속을 하니 403 Forbiddennginx 납니다.
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
jupyter note launch 무반응
강의와 동일하게 업그레디으 버전 6.5.2 버전으로 설치 후 launch버튼을 눌렀으나 강의처럼 새로운 창이 뜨지 않고 아무런 반응이 없어요. 새로고침도 해보고, 업그레이드도 해보고 다 해봤는데 전혀 무반응이네요. 어떻게 해야하나요
-
미해결[리뉴얼] 파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
'int' object is not callable
사용자 입력을 int 형 변환으로 받기 위해서 썼는데 저런 에러가 뜹니다. 찾아보니 예약어를 변수로 썼을 때 일어나는 에러라는데 전 int 를 변수로 쓰지 않았습니다. 왜 이런 걸까요?
-
해결됨파이썬으로 나만의 블로그 자동화 프로그램 만들기
vscode말고 cursor ai사용해도 되나요
vs코드랑 cursor랑 다른거죠..? vs코드에 ai 랑 이거저거 붙이면 cursor되는걸로 아는데 제가 이해를 제대로 한게 맞을까요.. 코드 완전 초보라 암것도 몰라요;