33,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결R로 하는 웹 크롤링 - 입문편
클리앙 크롤링-1 hit 관련 질문
안녕하세요, 현재 클리앙 공지가 2개라 hit <- (str_extract(b3, ("(?<=hit\">).*(?=</span>)"))[-1])[-1] 식으로 작성을 했는데, 이 방법 외에 다른 방법이 있는지 궁금합니다.
- 미해결R로 하는 웹 크롤링 - 입문편
("?<=).*(?=)") 활용 정규식 작성법 문의
안녕하세요, str_extract 정규식 이용해서 아래코드에서 타이틀만 추출하려고 할 경우 정규식 작성 방법 문의드립니다. title=\"언론권력이 검찰권력과 손잡을 때 벌어지는 일들\">" 아마도 title=\"로 시작해서 \">" 사이 값을 추출할 수 있도록 작성해야하는데 특수문자가 섞여있어서 헷갈리네요. 추가로 알려주신 정규식 이용해서 특정 문자열 추출하는게 초급자 입장에서 다소 어려운 것 같은데 혹시 더 쉽게 추출할 수 있는 방법이 있을까요?
- 미해결R로 하는 웹 크롤링 - 입문편
클리앙 크롤링-1 질문
게시글의 제목을 불러오는 부분에서 막혔는데요. 현재, 아래와 같이 subject_fixed 로 데이터를 불러오면 아래와같이 나오게됩니다. --------------------------------------------------------------------------------------------------------- > b2<-b[str_detect(b,"subject_fixed")] > b2 [1] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"바퀴달린 음악중심\">" [2] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"간만에 음중 처음부터 보는데...노래들이..가수들이...;;;;\">" [3] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"현금가 좀 싫네요ㅠㅠ\">" [4] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"설문조사 업체가 20분간격으로 전화하네요.\">" [5] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"오랜만에 음악중심 보네요\">" [6] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"지금 음중 나오는 노래...\">" [7] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"우유 드시면 소화 잘되시나요??\">" [8] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"정신나가기 시작한 강원도 토지 값\">" [9] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"휴대폰 전면 카메라 자주 쓰시나요??\">" [10] "\t\t\t\t\t\t<span class=\"subject_fixed\" data-role=\"list-title-text\" title=\"아니 제이블랙 형님 앨범냈어요?!\">" --------------------------------------------------------------------------------------------------------- 따라서 수업에서 진행한 아래와 다른 시작과 끝을 지정해줘야할 것 같아서 아래와 같이 짰는데 안돌아가네요... 뭐가 문제인걸까요 ㅠㅠ > title<-str_extract(b2,("(?<=\title=\").*(?=">"")) Error in UseMethod("type") : no applicable method for 'type' applied to an object of class "logical"
- 미해결R로 하는 웹 크롤링 - 입문편
클리앙 크롤링 2에서 질문있습니다.
for문 돌릴 떄 1. content라는 변수를 NULL로 선언하는 것과 c()로 하는 것의 차이가 있나요? 2. for문 중에서 content<-c(content, b6) 대신 rbind(content, b6)로 하면 content앞에 b6라는 문자가 다 붙는 오류가 나는데 왜 그런건가요?
- 미해결R로 하는 웹 크롤링 - 입문편
클리앙 싸이트 크롤링 질문 드립니다.
클리앙 싸이트 크롤링을 해보니 hit는 안 맞는듯합니다. 나중에 시간날때 확인한번 해주세요.. 공지사항이 2개가 있어서 그런것 같은데... 나머지는 잘되고.. 그래도 하나 하나 잘 배웠습니다. 감사합니다.
- 미해결R로 하는 웹 크롤링 - 입문편
네이버 주식 크롤링 (1) 질문드립니다.
네이버 주식 크롤링 (1) 질문드립니다. b<-htmltab(url, encoding="UTF-8") 코드 입력하면 Argument 'which' was left unspecified. Choosing first table. 라고 에러가 나오면 어떡해야 하나요?
- 미해결R로 하는 웹 크롤링 - 입문편
str_extract 자세하게 설명좀 해주세요
str_extract(b2,("?<=|">.*......)이부분 자세히 설명해주세요....대충 설명하고 넘어가셔서..이해를 못하겠어요 ㅠ 다른 사이트에서 이용 못할것같아요 ㅜ
- 미해결R로 하는 웹 크롤링 - 입문편
네이버 실시간 검색어 크롤링 질문드립니다.
네이버 메인에서 페이지 소스 보기를 해도 이제 더이상 실시간 검색어가 찾아지질 않습니다. 이 경우에 어떻게 크롤링해야 하는지 궁금합니다. 두번째 질문은 네이버 데이터랩 자료를 크롤링하려고 하는데, 자꾸 불완전한 마지막 행이 발견되었다는 에러메시지가 뜹니다. 소스 코드로는 url<-"https://datalab.naver.com/keyword/realtimeList.naver?where=main" b<-readLines(url,encoding="UTF-8") 를 입력하였는데, 이 경우 b의 값이 제가 아는 페이지 소스값과 너무 다르게 나와서 혼란스러운데 이 경우 데이터랩의 자료를 어떻게 가져와야 하나요?
- 미해결R로 하는 웹 크롤링 - 입문편
게시판의 내용 중 한글만 찾기 표현
readLines, str_extract 함수를 사용한 방법으로 게시판의 내용을 크롤링해보려고 합니다. 게시판에는 한글과 영어로 쓰여져 있는데, 한글문장만 가져오려면 어떤 정규식을 사용해야 하는 지문의드립니다.
- 미해결R로 하는 웹 크롤링 - 입문편
m3.csv 파일 저장 후 pc에서 열면 한글이 깨져요.
m3.csv 파일을 저장해서 pc에서 csv파일을 열면, '홀수', '짝수' 와 같은 한글이 깨져서 열립니다. 어떻게 해야 한글이 그대로 저장되나요?