33,000원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨빅분기 실기 1Day Class(R)
기출예제세트2 중에서 작업형 제2유형 질문있습니다.
- #### [[ 작업형 제 2유형 ]] ##### 차량 가격을 예측하기 위해 선형 회귀분석을 활용하고자 한다.# 종속변수: Price# 독립변수: Age, KM, HP, Automatic, cc, ABS, Airco# 상기 조건을 기반으로 CD 플레이어가 있는 차량 데이터로 모델을 생성했을 때,# 해당 모델을 기준으로 모든 조건이 동일하다고 할 때 3개월을 더 운전했다면# 차량 가격의 변화량을 정수부분만 출력하시오.# ※ Age는 차량 출고 후 실사용 기간을 월 단위로 기록한 변수# 답안 예시: 123 1번 floor(as.numeric(coef(model)[2]*3))1번으로 하면 -542 2번 as.integer(as.numeric(coef(model)[2]*3))2번으로 하면 -541인데요 문제에서처럼 정수부분만 출력하시오 이러면1번처럼으로 해야 하나요2번으로 해야 하나요강의에서는 1번으로 설명하셨는데......좀 더 자세한 설명 부탁드립니다.^^~
- 미해결빅분기 실기 1Day Class(R)
작업형제1유형 2번 문제 질문입니다.
# Q2. 데이터 수집일 중 맑은 날의 비중을 백분률로 소수점 둘째 자리까지 출력하시오.# ※ 맑은 날은 weather가 1인 비중이 가장 많은 날을 기준으로 한다.# 답안 예시: 12.34 ds=read.csv('set_01_data_02.csv')str(ds)summary(ds)head(ds)cnt=ds%>%filter(weather==1)%>%summarise(n=n())tot_cnt=length(ds$weather)result=cnt/tot_cntprint(result)이렇게 문제풀면 왜 안되는 건가요? 혹시 답이 나오게 할려면 어느 부분을 수정하면 가능할까요?
- 미해결빅분기 실기 1Day Class(R)
교육자료가 Zip파일로 되어있다고 하는데 찾을 수가 없네요..
안녕하세요? 교수님의 강의를 듣게 되어 감사하게 생각하고 있습니다. 근데 교육자료가 zip파일로 되어 있다고 안내를 본것같은데 아무리 찾아도 찾을 수가 없네요.. 어디서 교육자료를 찾을 수 있는지 알려 주실 수 있는지요
- 미해결빅분기 실기 1Day Class(R)
cross validation score negative
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요. cross validation관련 하여 질문드리고자 합니다. 모델을 만든 후 데이터 셋에 대하여 cross val을 실행하였는 데요. train 데이터에 대해서는 0.56 정도의 스코어가 나왔는 데 cross val을 통한 스코어 평균 값은 -0.07 가 나왔습니다. 이렇게 다르게 나오는 이유가 궁굼합니다. 답변 주시면 정말 감사합니다.
- 미해결빅분기 실기 1Day Class(R)
이상치 수업 내용 질문
선생님꼐서 이상치 수업으로 출력하신 부분이 > print(df_out) id rating_count_tot rating_count_ver user_rating 1 284035177 1126879 3594 4 11 284993459 402925 136 4 위 결과이고 수업 마지막에 표준편차와 평균을 사용해서도 이상치를 알아낼 수 있다고 하셔서 똑같이 해보았는데요 cond5 = df$rating_count_tot > (stat_mean + 2 * stat_sd) cond6 = df$rating_count_tot < (stat_mean - 2 * stat_sd) df_out2 = df[cond5 | cond6, ] 위 처럼 코드를 실행했을 때 결과가 id rating_count_tot rating_count_ver user_rating 1 284035177 1126879 3594 4 위와 같이 나옵니다. 이게 맞는 결과인지 알고싶어요 그리고 혹시 맞다면 왜 결과가 다르고, 어떨 때 둘을 구분지어서 사용해야 하나요??
- 미해결빅분기 실기 1Day Class(R)
CV(Cross Validation)
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 . CV 학습 하다 헷갈리는 개념이 있어서 질문 드립니다. CV 개념으로 K번의 검증을 통해 모델의 신뢰를 더 높인 다는 목적이라고 이해를 했는데 즉 Train(train + Validation) / Test 에서 train + Validation 부분을 여러 개 분할 해서 할당하고 평균으로 더 좋은 모델을 만드는 개념 아닌가요?? 개념 설명 이후 교재와 코드에서는 Test라고 용어가 나와서 헷갈려요ㅠ
- 해결됨빅분기 실기 1Day Class(R)
범주형 변수 군집 분석
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 안녕하세요 강의에서 연속형 변수로 거리 계산후 클러스터링 하는 계층적/비계층적 방법에 배웠습니다. 범주형 변수(명목형 변수)에서도 유사도 분석? 거리 계산 가능한 방법이 있는 것 같은데, 명목형 변수들로만 구성된 데이터에서도 클러스터링 할 수 있는 방법이나 패키지를 알 수 있을까요?
- 미해결빅분기 실기 1Day Class(R)
이상치 관련
q1 = quantile(mtcars$wt., probs = 0.25) q3 = quantile(mtcars$wt, probs = 0.75) iqr = IQR(mtcars$wt) cond1 = mtcars$wt < q1 - 1.5 * iqr cond2 = mtcars$wt > q3 + 1.5*iqr outlier <- mtcars$wt[(cond1) | (cond2)] 해당 코드를 작성하고 outlier 변수를 출력하면 na값이 같이 출력이 되는데 그 이유와 해결방법을 알고 싶습니다
- 미해결빅분기 실기 1Day Class(R)
[기출 예제 세트 3] 7:50
수업에서 진행한 코드 관련해서 문의드립니다. [기출 예제 세트 3] 7:50 에서 summary(model)[[1]]$`F value` 위 코드에서 summary 함수가 모델의 결과 리포트에 대한 질문은 다음과 같습니다. 1. 인덱싱이 왜 [[1]]로 나타내는 건가요? 리포트 안에 결과값이 보편적으로 어떤 인덱싱을 가지는지 모르니 왜 [[1]]을 쓰는지 모르겠습니다. 2. $ 특별연산자는 리포팅 안의 컬럼을 지정하기 위해 사용된건가요? 3. ``는 어떤 용도로 쓰이는지 알 수 있을까요? 감사합니다.
- 미해결빅분기 실기 1Day Class(R)
confusionMatrix 관련 질문
위 처럼 table결과값을 confusionMatrix에 넣었을 때 인수가 누락됐다고 나오는 경우는 어떻게 해야하나요?
- 미해결빅분기 실기 1Day Class(R)
질문입니다
선생님 그렇다면 wday함수로 datetime을 추출했을 때 저는 숫자(1~7)로 나오는데 6과 7이 각각 토요일과 일요일이라고 생각하고 문제를 풀면 되나요?
- 미해결빅분기 실기 1Day Class(R)
예제1. 작업형 제 1유형
선생님 안녕하세요. 예제 1번 문제에서 평일 오후 1시라는 전제를 두셨는데 해설에는 없는 거 같아서요. 이를 처리하기 위해 wday함수를 사용하여 filter를 사용해야 하는것은 아닌지 궁금합니다. 감사합니다.
- 미해결빅분기 실기 1Day Class(R)
기출 예제 세트 1 - 정답 풀이 中 2번째 문제 풀이 관련(09:00)
안녕하세요 1. 기출 예제 세트 1 - 정답 풀이 中 2번째 문제풀이(09:00쯤) 관련해서 저는 문제 풀이와 다른 방법으로 최빈값 사용자 함수 만들어서 필요한 컬럼만 추출해서 값을 구해봤는데요 풀어주신 방법과 결과가 달라요.. 이유는 잘 모르겠는데 이렇게 풀면 안 되는 건가요? df_02 <- read.csv('set_01_data_02.csv') library(dplyr) Mode <- function(x){ ux <- unique(x) ux[which.max(tabulate(match(x,ux)))] } df_021 <- df_02 %>% select('date','weather') df_022 <- df_021 %>% group_by(date) %>% summarize(mode_weather=Mode(weather)) table(df_022$mode_weather) 2. 결과가 모범 답안의 결과와 다르면 0점 처리되나요? 3. 빈도가 동일하여 최빈값이 2개가 나오는 경우 어떻게 처리해야 할까요?
- 미해결빅분기 실기 1Day Class(R)
분류모델 강의 df[, "Species"]와 df$Species 차이
안녕하세요. 선생님, R 입문자입니다.^^ 분류모델 강의 내용을 실습하다가 모르는 부분이 있어서 질문 드립니다. df[, "Species"]<-ifelse(df$Species=="virginica",1,0) model<-glm(Species~., df, family="binomial") 결과와 df$Species<-ifelse(df$Species=="virginica",1,0) 결과의 차이가 있는데 이유를 잘 모르겠습니다. 설명 부탁 드립니다. 감사합니다.