묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결데이터분석 준전문가(ADsP) 자격증 대비
강의 오류 있어요 두 강의가 같네요
군집 분석 - 분할적(=비계층적) 군집 14분군집 분석 평가, 결과 해석 14분
-
미해결실무자를 위한 데이터 시각화
질문 있습니다!
> stock.data<-read.csv("kospi.csv")file(file, "rt")에서 다음과 같은 에러가 발생했습니다: 커넥션을 열 수 없습니다추가정보: 경고메시지(들):file(file, "rt")에서: 파일 'kospi.csv'를 여는데 실패했습니다: No such file or directory 이런 문구가 나오는데 오류 해결 방법이 어떻게 되나요?
-
미해결ADsP 2주 합격 올인원 패스
3과목 교재 누락
안녕하세요.교재에 3과목 머신러닝 개념과 지도학습 비지도학습 강화학습 이해 와 머신러닝 용어정리 및 정리 부분이 누락되어있습니다.
-
미해결데이터분석 준전문가(ADsP) 자격증 대비
3과목 데이터 분석 통계분석 강의자료
3과목 데이터 분석-통계분석 강의자료와 강의순서가 일정하게 맞지 않아 같이 보는데 불편함이있습니다.동영상 강의와 맞는 강의자료 업로드 부탁드립니다.
-
미해결데이터분석 준전문가(ADsP) 자격증 대비
2과목 분석과제 도출방법 하향식 접근방식 영상이 이전 영상과 동일합니다.
2과목 분석과제 도출방법 하향식 접근방식 영상이 이전 영상과 동일합니다.
-
미해결데이터분석 준전문가(ADsP) 자격증 대비
3과목-2통계+분석(pdf) 파일 안 열려요
안녕하세요 통계분석 pdf 파일 다운로드가 안되네요 확인 좀 부탁드려도 될까요
-
해결됨[R을 R려줘] R 데이터 시각화
unique 함수 처리 결과
다음과 같이 csv 데이터를 불러오고 unique(df$지역) 함수를 실행했는데 강의에서와 다르게 "타시도", "강동구", "서초구"만 출력되는데 이유가 있을까요?df = read.csv("Seoul_COVID19_20210511.csv", fileEncoding = "cp949") head(df, 2) head(df[, 1:6], 2) unique(df$지역)
-
미해결[R을 R려줘] R 데이터 시각화
rgdal 라이브러리
> install.packages("rgdal") WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding: https://cran.rstudio.com/bin/windows/Rtools/ ‘C:/Users/magne/AppData/Local/R/win-library/4.3’의 위치에 패키지(들)을 설치합니다. (왜냐하면 ‘lib’가 지정되지 않았기 때문입니다) Warning in install.packages : package ‘rgdal’ is not available for this version of R A version of this package for your version of R might be available elsewhere, see the ideas at https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packagesrgdal 라이브러리를 설치하려고 하였는데 다음과 같은 메세지가 뜨며 설치가 되지 않습니다. 최신 버전에서는 rgdal 라이브러리가 안되는 건가요?
-
해결됨[R을 R려줘] R 데이터 시각화
countries110 관련 질문
countries110@data 코드를 실행했을 때 다음과 같이 에러문구가 뜨면서 실행이 안되는데 왜 그런 것일까요? countries110@data에서 다음과 같은 에러가 발생했습니다: no applicable method for `@` applied to an object of class "sf"
-
미해결[R을 R려줘] R 기초다지기
보통명사 추출하기
안녕하세요 저는 선생님 강의도 듣고, 블로그도 보면서 보통명사 추출하는 함수를 생성해서 tm패키지를 활용해 코퍼스로 변환하는 내용을 공부하고 있습니다~ 커스텀함수는 이렇게 입력하고words<-function(text){ text<- as.character(text)extractNoun(text) 이후 변환을 하려고 하는데doc<- TermDocumentMatrix(doc, control = list( tokenize= words removeNumbers =T removePunctuation =T wordlengths= c(3,Inf))) tokenize, removeNumbers, removePunctuation, wordsLengths와 제가 커스텀한 함수(words)가 인식이 안됩니다.~are ignored 라는 경고가 뜨거나예상하지 못한 기호(symbol)입니다 라는 에러가 뜹니다.. 해결방법을 알고 계시는지요.
-
미해결[R] KOSPI/KOSDAQ 전 종목 데이터 수집 및 관리
library(htmltab)는 실행시키면 실행이 안됩니다.
어제 R studio를 여기서 하는데로 최신버전으로 깔았고,여기서 하라는 데로 그대로 설치를 했습니다.그리고 여기 강의를 들으면서 따라하던 중..library(htmltab) 이것을 실행시키면 아래와 같은 문구가 뜨네요..library(htmltab)에서 다음과 같은 에러가 발생했습니다:‘htmltab’이라고 불리는 패키지가 없습니다.잠시install.packages("htmltab")을 실행하지 않아서 그런가 봤더니. 그것도 아니어서... 그래서 더 낮은 32bit버전으로 깔고 해봤는데요... 똑 같습니다.. 그래서 인터넷에 검색해보니..Package ‘htmltab’ was removed from the CRAN repository.이렇게 나오네요..여기 나와 있는 밑에 답변이 있길래 기쁜마음에 복사해서 붙여놓고 하나하나 실행시켜봤습니다.. setwd("D:\\stock")#library(htmltab)url<-"http://finance.naver.com/item/sise_day.nhn?code=005380&page=1" # 종목 Aurl<-"http://finance.naver.com/item/sise_day.nhn?code=005930&page=1" # 종목B#install.packages("httr")library(httr)referer <- add_headers(Referer = "http://finance.naver.com/item/sise_day.nhn?code=005380&page=11") #검색해서 들어간 것처럼 위장하기위해 header를 붙여준다tmp <- GET(url, referer) # GET함수를 통해 해당 서버에 통신을 함 뒤에 referer인자가 위장술ta<-read_html(tmp)%>% html_nodes(xpath = '/html/body/table[1]') %>% html_table()ta2<-(ta[[1]])ta2[-c(1,7,8,9,15),]code_data <- read.csv("data.csv",sep="\t")? read.csvhead(code_data)code <- as.character(code_data[,1])code_name <- as.character(code_data[,2])re_code <- as.character(sapply(code,function(x){ nc<- 6-nchar(x) paste0(c(rep(0,nc),x),collapse = "")}))k <- 1i <- 1for(k in 1:length(re_code)){ final_data<-NULL for(i in 1:10){ url <- paste0("https://finance.naver.com/item/sise_day.nhn?code=",re_code[k],"&page=",i) b <- htmltab(url,encoding="UTF-8") b final_data < -rbind(final_data,b) cat("\n",i) } head(final_data) tail(final_data) dim(final_data) ..........결과는 몇줄 가지도 못하고 바로add_headers(Referer = "https://finance.naver.com/item/main.naver?code=005380")에서 다음과 같은 에러가 발생했습니다: 함수 "add_headers"를 찾을 수 없습니다로 나옵니다.. 이 문제가 반드시 해결이 되야 밑에 코딩한게 전부 의미가 있을 것 같습니다.
-
미해결[R] KOSPI/KOSDAQ 전 종목 데이터 수집 및 관리
한국거래소에서 전종목 코드를 받는 기존 메뉴는 사라졌습니다.
한국거래소를 타고서 예전에는 받을 수 있었던 것 같은데,현재는http://data.krx.co.kr/contents/MDC/MDI/mdiLoader/index.cmd?menuId=MDC0201020303이 곳으로 들어가야 종목코드를 다운받을 수 있게 바뀌었네요.. 초보라 한참 찾았습니다. 그리고 강의하시는 제목 "stock R"이 사실은 다운로드 받은 자료의 "naver증권크롤링_예제.R"이네요
-
해결됨[R을 R려줘] R 기초다지기
사용자 정의 함수
사용자 정의 함수를 생성할 때 중괄호 위치가 중요한가요? return과 같은 줄에 사용하면 에러가 뜨고 밑줄에 사용하면 정상적으로 작동하는데 그 이유가 무엇인가요?
-
해결됨[R을 R려줘] R 기초다지기
스크립트 사이드바 x 표시
rstudio에서 script의 사이드바에 잘못된 문자열을 입력하였을 때 빨간색 x가 표시가 안되는데 표시가 되도록 하는 방법이 있나요?
-
해결됨[R을 R려줘] R 데이터 시각화
scirpt_v2_2
getwd() setwd("C:/Users/yun/Desktop/") #### 1. 인구 통계 처리 #### df_pop = read.csv("Population.csv") head(df_pop) df_pop[, "value"] = gsub(pattern = ",", replacement = "", df_pop$value) class(df_pop$value) df_pop[, "value"] = as.numeric(df_pop$value) head(df_pop) df_pop = df_pop[, c("name", "value")] head(df_pop) # colnames(df_pop) = c("country", "pop") head(df_pop, 2) #### 2. 백신 접종 데이터 처리 #### df = read.csv("country_vaccinations.csv") head(df, 2) df = df[, c("country", "iso_code", "date", "total_vaccinations", "vaccines")] head(df) colnames(df)[4] = "total" head nrow(df) df_agg = aggregate(data = df[, -5], total ~ ., FUN = "sum") #######? class(df_agg$date) df_agg[, "date"] = as.Date(df_agg$date) nrow(df_agg) head(df_agg) min(df_agg$date) max(df_agg$date) df_agg_unique = unique(df_agg[, c("iso_code", "date")]) #겹치는 항목 날리기 head(df_agg_unique) #가장최근값만 얻기(2021년도 백신접종데이터만 알면됐지, 2020년도는 알필요 없으니까) df_agg_unique = aggregate(data = df_agg_unique, date ~ iso_code, FUN = "max") head(df_agg_unique) library("dplyr") df_vac = left_join(df_agg_unique, df_agg, by = c("iso_code" = "iso_code", "date" = "date")) df_vac=df_vac[,c(3,2,1,4)] head(df_vac) #### 3. 세계 지도 데이터 처리 #### library("rnaturalearth") df = countries110 head(df, 2) library("ggplot2") ggplot() + geom_sf(data = df, color = "#000000", fill = "#FFFFFF") #### 4. 데이터 병합 및 시각화 #### head(df) df_map_id = data.frame(id = 0:(length(df$ISO_A3) - 1), iso = df$ISO_A3) head(df_map_id) length(unique(df_map_id$iso)) class(df_map_id$id) head(df, 2) df_map_id[, "id"] = as.character(df_map_id$id) df=df[,c("ISO_A3","geometry")] df_map_join = left_join(df, df_map_id, by = c("ISO_A3" = "iso")) head(df_map_join) ggplot(data = df_map_join, aes(fill = id)) + geom_sf(color = "#000000") + theme(legend.position = "none") df_map_join_vac = left_join(df_map_join, df_vac, by = c("ISO_A3" = "iso_code")) head(df_map_join_vac) ggplot(data = df_map_join_vac, aes(group = id, fill = total)) + geom_sf(color = "#000000") + theme_bw() + theme(legend.position = c(0.1, 0.35)) #### Quiz #### head(df_map_join_vac) df_vac_2 = left_join(df_map_join_vac, df_pop, by = c("country" = "country")) head(df_vac_2) df_vac_2[, "ratio"] = df_vac_2$total / df_vac_2$pop head(df_vac_2) ggplot(data = df_vac_2, aes(group = id, fill = ratio)) + geom_sf(color = "#000000") + theme_bw() + theme(legend.position = c(0.1, 0.35)) 올렸습니다. 도움부탁드립니다. 그리구 외국에서 돌아오시면 자료를 받아서 공공데이터시각화도 듣고싶습니다.아 그리고, (지금과 반대로, 지금은 백신접종률이 높을수록 색의 연해짐) ratio이 높을수록 색깔이 점점더 진한것이 보기에 더 효과적일것같아요. 그건 코드로 구현이 어렵겠죠..? 그리고 이 na결측치는 없애야되는게 맞죠?
-
해결됨[R을 R려줘] R 데이터 시각화
scirpt_v2
이렇게 말씀하시면 이해하기가 어렵습니다.새로 올려주신 script_v2 그대로도 몇번이나 돌려봤습니다.강의에서 이렇게 말해주신 파트가 script_v2에서는 이부분 입니다. 일단 이렇게 그대로 따라하면 df_map_join = left_join(df, df_map_id, by = c("ISO_A3" = "iso")) Error in `sf_column %in% names(g)`: ! Join columns in `x` must be present in the data. ✖ Problem with `ISO_A3`. Run `rlang::last_trace()` to see where the error occurred.이런 에러가 떠서 "ISO_A3"를 -> "iso_a3"로 바꿔주었구요. 이건뭐 상관없고, 불필요한 변수를 미리 제거하라고 하셨는데>head(df_map_join) Simple feature collection with 6 features and 169 fields Geometry type: MULTIPOLYGON Dimension: XY Bounding box: xmin: -180 ymin: -18.28799 xmax: 180 ymax: 83.23324 Geodetic CRS: WGS 84 featurecla scalerank labelrank sovereignt sov_a3 adm0_dif 1 Admin-0 country 1 6 Fiji FJI 0 2 Admin-0 country 1 3 United Republic of Tanzania TZA 0 3 Admin-0 country 1 7 Western Sahara SAH 0 4 Admin-0 country 1 2 Canada CAN 0 5 Admin-0 country 1 2 United States of America US1 1 level type tlc admin adm0_a3 geou_dif 1 2 Sovereign country 1 Fiji FJI 0 2 2 Sovereign country 1 United Republic of Tanzania TZA 0 3 2 Indeterminate 1 Western Sahara SAH 0 4 2 Sovereign country 1 Canada CAN 0 5 2 Country 1 United States of America USA 0 geounit gu_a3 su_dif subunit su_a3 brk_diff 1 Fiji FJI 0 Fiji FJI 0 2 Tanzania TZA 0 Tanzania TZA 0 3 Western Sahara SAH 0 Western Sahara SAH 1 4 Canada CAN 0 Canada CAN 0 5 United States of America USA 0 United States USA 0 name name_long brk_a3 brk_name brk_group abbrev 1 Fiji Fiji FJI Fiji <NA> Fiji 2 Tanzania Tanzania TZA Tanzania <NA> Tanz. 3 W. Sahara Western Sahara B28 W. Sahara <NA> W. Sah. 4 Canada Canada CAN Canada <NA> Can. 5 United States of America United States USA United States <NA> U.S.A. postal formal_en formal_fr name_ciawf note_adm0 1 FJ Republic of Fiji <NA> Fiji <NA> 2 TZ United Republic of Tanzania <NA> Tanzania <NA> 3 WS Sahrawi Arab Democratic Republic <NA> Western Sahara <NA> 4 CA Canada <NA> Canada <NA> 5 US United States of America <NA> United States <NA> note_brk name_sort name_alt mapcolor7 1 <NA> Fiji <NA> 5 2 <NA> Tanzania <NA> 3 3 Self admin.; Claimed by Morocco Western Sahara <NA> 4 4 <NA> Canada <NA> 6 5 <NA> United States of America <NA> 4 mapcolor8 mapcolor9 mapcolor13 pop_est pop_rank pop_year gdp_md gdp_year 1 1 2 2 889953 11 2019 5496 2019 2 6 2 2 58005463 16 2019 63177 2019 3 7 4 4 603253 11 2017 907 2007 4 6 2 2 37589262 15 2019 1736425 2019 5 5 1 1 328239523 17 2019 21433226 2019 economy income_grp fips_10 iso_a2 iso_a2_eh iso_a3 1 6. Developing region 4. Lower middle income FJ FJ FJ FJI 2 7. Least developed region 5. Low income TZ TZ TZ TZA 3 7. Least developed region 5. Low income WI EH EH ESH 4 1. Developed region: G7 1. High income: OECD CA CA CA CAN 5 1. Developed region: G7 1. High income: OECD US US US USA iso_a3_eh iso_n3 iso_n3_eh un_a3 wb_a2 wb_a3 woe_id woe_id_eh 1 FJI 242 242 242 FJ FJI 23424813 23424813 2 TZA 834 834 834 TZ TZA 23424973 23424973 3 ESH 732 732 732 -99 -99 23424990 23424990 4 CAN 124 124 124 CA CAN 23424775 23424775 5 USA 840 840 840 US USA 23424977 23424977 woe_note adm0_iso adm0_diff adm0_tlc adm0_a3_us adm0_a3_fr 1 Exact WOE match as country FJI <NA> FJI FJI FJI 2 Exact WOE match as country TZA <NA> TZA TZA TZA 3 Exact WOE match as country B28 <NA> B28 SAH MAR 4 Exact WOE match as country CAN <NA> CAN CAN CAN 5 Exact WOE match as country USA <NA> USA USA USA adm0_a3_ru adm0_a3_es adm0_a3_cn adm0_a3_tw adm0_a3_in adm0_a3_np adm0_a3_pk 1 FJI FJI FJI FJI FJI FJI FJI 2 TZA TZA TZA TZA TZA TZA TZA 3 SAH SAH SAH SAH MAR SAH SAH 4 CAN CAN CAN CAN CAN CAN CAN 5 USA USA USA USA USA USA USA adm0_a3_de adm0_a3_gb adm0_a3_br adm0_a3_il adm0_a3_ps adm0_a3_sa adm0_a3_eg 1 FJI FJI FJI FJI FJI FJI FJI 2 TZA TZA TZA TZA TZA TZA TZA 3 SAH SAH SAH SAH MAR MAR SAH 4 CAN CAN CAN CAN CAN CAN CAN 5 USA USA USA USA USA USA USA adm0_a3_ma adm0_a3_pt adm0_a3_ar adm0_a3_jp adm0_a3_ko adm0_a3_vn adm0_a3_tr 1 FJI FJI FJI FJI FJI FJI FJI 2 TZA TZA TZA TZA TZA TZA TZA 3 MAR SAH SAH SAH SAH SAH MAR 이걸 어떻게 제거하나요?올려주신 script_v2 파일을 다시 재확인 및 수정부탁드립니다. 그리고위,위에 출력코드 보시면 아시겠지만바로 위 사진처럼 long lat order hole piece id group 그 어떤것도 찾을수없습니다.지도가며칠동안 이것만 붙잡고있는데 진도가 못나가서 너무 답답합니다.ㅏscript_v2랑 올려놓으셨던 강의랑 비교하셔서 수정부탁드립니다. ratio 범례도 , 강의보면서 코드계속 돌려봤습니다.1 2 3 으로 나옵니다. 강의처럼 0.9 0.8 이렇게 나오질 않습니다.
-
해결됨[R을 R려줘] R 기초다지기
wday() 함수
안녕하세요?date_01 = ymd("2030년 1월 1일")wday(date_01)을 출력하면 3이 나오는 이유를 수업에서 넘어가신 것 같습니다ㅠ그 이후로 week_start = 1은 월요일을 시작점으로 두는 거고, 보통 week_start는 일요일로 처음에 잡혀있다고 하셨으니, 일요일을 1로 생각하면 화요일이 3으로 나오는 것 추측됩니다만 잘 모르겠습니다ㅠ 만약 제 추측이 맞다면 더 헷갈리는데, week_start = 1이 월요일이니, week_start = 0은 일요일을 뜻하나요? 그럼 0 , 1, 2해서 화요일은 2가 나와야 하지 않나라는 생각도 들어서요...ㅠ
-
해결됨[R을 R려줘] R 기초다지기
typeof(123)
안녕하세요?혹시 typeof(123)을 하면 왜 integer가 아닌 double을 출력하는지 알 수 있을까요?ㅠㅠ
-
미해결R을 활용한 데이터 통계 분석
강의에 쓰이는 data는 어디서 다운 받나요?
강의에 쓰이는 data는 어디서 다운 받나요?
-
해결됨[R을 R려줘] R 데이터 시각화
백신접종데이터강의/df_map_join_vac 무슨 값을 가지고있는지 데이터시각화 어려움
본강의영상에는 마지막에 df_map_join_vac라는 값이 console을 보면 깔끔하고 가독성좋게 데이터시각화되어 표기되는것을 확인할수있습니다.이번에 새로 올려주신 scrips_v2 파일을 보면서 공부를 하고 있는데요. 세계지도 시각화를 만들기위해 모든과정을 거쳐 마지막에 넣는 값 df_map_join_vac가 무슨 값을 가지고있는지 알아보기가 매우 힘듭니다.