60,500원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
새로 추가된 라이브러리
실기 4회 수정된 공지사항에서 R에 gbm, lightgbm 라이브러리가 추가되었다고 하는데, 기존 스크립트만 잘 익히면 따로 연습할 필요가 없는 라이브러리 인가요~? 시험을 위한 강의로서 선생님만한 강의가 없습니다. 감사하게 생각하며 열심히 공부하고 있습니다.
- 미해결빅데이터분석기사 실기대비 (R 활용)
preProcess 함수 적용하는 개념
preProcess 함수 적용하는 개념을 잘 모르겠습니다. model1, model2 등 모델을 생성하기전에 preProcess 함수를 사용하여 진행하는 과정을 간단하게 예를들어주시면 감사하겠습니다. 그리고 최근 질문 이전 질문에 대한 답변도 참고하고 싶은데 확인할 수 있는 경로 부탁드립니다.
- 미해결빅데이터분석기사 실기대비 (R 활용)
caret::confusionMatrix 문의
안녕하세요 caret::confusionMatrix(test$y, p4)로 강의에서 알려주셨는데 사용법에 보면 confusionMatrix(data, reference)로 되어있어서 실제값과 예측값 순서가 바뀐건 아닌지해서 질문드립니다.
- 미해결빅데이터분석기사 실기대비 (R 활용)
회귀분석 성능지표
안녕하세요. 비전공자이고, 이번 4회 필기 시험에서 된통 당했던 기억(?) 때문인지 곧 다가올 실기 시험에서 두려움을 느껴 많은 질문들을 하게 되네요. 회귀분석에서 성능평가에 대해 말씀해주셨는데요. 결정계수 구하는 문제가 출제될 가능성이 있을까요? 만약 나오게 된다면, R2은 R2(test$000, p3)으로 쉽게 구할 수 있는데 수정된 결정계수를 구하는 방법에 대해 질문드립니다. 구글링에서 찾아보면 라이브러리를 불러와야하는 것 같더라고요. 알려주신 라이브러리 안에서 구할 수 있는지요? 함수가 없다면 MAPE처럼 직접 공식으로 나타내야할까요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
회귀 예측에서 변수 선택
안녕하세요. 여러 질문을 드림에도 친절하고 상세한 답변 항상 감사드립니다. 작업형 2에서 회귀 예측 문제가 나올 경우, 그리고 해당 df에서 변수가 무진장 많고 numeric과 캐릭터형 들이 산재되어 있을때 범주형 변수인 캐릭터형을 굳이 팩터형으로 바꾸지 않고 연속형 numeric 또는 integer 형만 따로 select하도록 전처리를 하면 될까요? 연습하다가 아래와 같은 데이터프래임을 마주하게 되었는데요. SalePrice를 예측하는 문제입니다. 저렇게 많은 변수들이 나오게 되면 일일이 select 지정해야겠죠?
- 미해결빅데이터분석기사 실기대비 (R 활용)
auc값이 1을 넘어가는 경우
선생님 안녕하세요, 기출2회 작업형2유형을 선생님께서 알려주신 방법대로 풀었는데요, 마지막에 평가부분에서 분할한 30%의 데이터로 p3의 predict값을 구하고, 이를 활용해 auc값을 구해봤는데, 3이 넘어가는 수가 나오더라구요.... 혹시 아래 코드에서 무엇이 잘못되었을까요ㅜ 감사합니다!
- 미해결빅데이터분석기사 실기대비 (R 활용)
작업형 2유형에서 질문 드립니다.
안녕하세요. 작업형 2유형에서 강의 주신 범위에서는 train과 test가 주어지던가 X train, Y train, X test로 주어지는 두 가지 방향에 대해서 말씀 해주셨는데요. 만약 train data 한 개만 주어지는 경우도 생길까요? 이러한 경우, x_train, y_train, x_test, y_test를 각각 나누어 예측 및 분류 모형을 만들 수 있도록 data partition 코드 설명 가능 할까요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
팩터형 변수가 많을 경우
안녕하세요 작업형2 예제 문제에서 주구매상품이랑 주구매지점의 경우 팩터형 변수로 지우고 분석해도 모델성능에 큰 차이는 없다라고 하셨습니다. 혹시 다른 데이터 예시에서 변수는 20개 정도 되고 팩터형 변수가 15개 정도(레벨수 2~4개) 된다고 하면 분석을 어떻게 해야할까요? 팩터형 변수를 전부 삭제하는 방법은 안될 것 같아서요..
- 미해결빅데이터분석기사 실기대비 (R 활용)
read.csv 오류
안녕하세요! R 4.2.0 최신 버전이 컴퓨터에 깔려있었어서 그걸로 수강중인데요 X_test 파일에 한글이 있어서 type.convert.default(data[[i]], as.is = as.is[i], dec = dec, 에서 다음과 같은 에러가 발생했습니다: '<b0><f1><c7><c1>'에서 유효하지 않은 멀티바이트 문자열이 있습니다 라는 오류메세지가 뜹니다. 파일에서 한글을 전부 삭제한 후에 read.csv하니까 오류가 나지 않는데, 한글을 삭제하는 것 외에 다른 방법이 있을까요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
혹시 Cabin이... 답일까요?
안녕하세요. 수업 열심히 잘 듣고 있습니다~ (sum(is.na(df$Cabin))+sum(df$Cabin=='', na.rm=T))/nrow(df) 0.7710438 (sum(is.na(df$Embarked))+sum(df$Embarked=='', na.rm=T))/nrow(df) 0.002244669 이렇게 나오는데 여러번 해보았지만 같은 결과만 나옵니다. T.T data 열어서 봐도, Cabin에 빈값이 엄청 많은데요... 혹시 답이 Cabin인지요? 아니면 강의하실 때 train.csv 파일과 제가 다운 받은 파일이 다른 파일일까요...
- 미해결빅데이터분석기사 실기대비 (R 활용)
소수점을 변경하는 방법
만약에 print() 적용한 출력값에 소수점 n 자리로 출력하라는 문제가 나올 경우, 소수점을 변경하는 방법은 어떤게 있나요? 구글링 해보면 R 자체의 옵션값을 변경하라고 하는데, 저는 단지 출력값만 소수점 n 자리로만 하고 싶거든요.
- 미해결빅데이터분석기사 실기대비 (R 활용)
3회 실기시험 리뷰 작업형 2유형
작업형 2유형에서 강의시에는 x 항목 인덱스를 삭제하는 코드가 있었는데 배포해주신 자료에는 x 항목 인덱스를 제거하는 코드가 빠져있습니다. 최종 제출시 인덱스를 추가하기 위해 일부러 삭제하신 건지요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
시험 환경과 관련하여 몇가지 문의 드립니다.
1. 작업 2유형에서 결측치는 답변 주신대로 bagImpute를 사용하여 쉽게 정제 가능하다고 하셨습니다. 만약 이상치를 탐색할 때 금액의 경우에는 음수로 표시되어있는 것을 이상치라고 말씀해주셧는데요. 이외에 이상치로 알아볼 수 있는 종류는 어떤 것들이 있을까요? 이상치를 boxplot을 통하여 확인해도 될까요? 만약 가능하다면 boxplot을 확인할 수 없는지요? 2. 전체 코드 실행이 1분 미만이라고 하셨는데요. 중간중간 str 또는 summary 함수를 확인하고 완료가 되면 최종 제출하기 전 이러한 확인용 함수를 제거하면 될까요? str과 summary를 확인하는게 너무 습관화가 되어 조금 신경이 쓰이네요.
- 미해결빅데이터분석기사 실기대비 (R 활용)
p3의 model은 어떻게 구하는지요?
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. 강사님 안녕하세요. 열심히 수업 듣고 있습니다. p1과 p2는 model1과 model2를 predict해서 구한 값이고, p3는 p1과 p2를 사용해 구한값입니다. 그렇다면, model3를 만들어서 p3 <- predict(model3, test)와 같이 구할 수는 없는지요?
- 미해결빅데이터분석기사 실기대비 (R 활용)
모델 생성 전 preProcess 적용 시 성능에 대한 질문
안녕하세요. 모델 생성 하기 전 df를 preProcess 함수를 적용하여 표준화 또는 일반화를 하고나서 모델을 생성하게되면 성능이 더 좋아지는지요? 실제 시험에서도 표준화, 일반화 등을 하면 좋을지요? 그리고 bagImpute를 실제 시험에서 적용하여 NA값을 조정해주어도 될까요? NA가 있는 칼럼이 많으면 각각 조정하는게 헷갈리거나 실수가 생길 수 있을 것 같아서요.
- 미해결빅데이터분석기사 실기대비 (R 활용)
rpart나 svm 중 높은 Accuracy값 찾기가 나온다면...
rpart나 svm 중 높은 Accuracy값을 가지는 내용을 작성시.. rpart는 강의 내용처럼 하면되는데 svm은 model1<-train(pre~., data=train, method='rpart') model2<-train(pre~., data=train, method='svm') 에러: Model svm is not in caret's built-in library 위와같이 진행하면 오류가 발생됩니다. 그래서 다시 아래와 같이 진행한 후 model2<-svm(pre~., data=train, type='C-classification') p1<-predict(model1, test, type='prob') p2<-predict(model2, test, type='prob') auc(test$pre, p1[,2]) auc(test$pre, p2[,2]) <= 오류발생됩니다.이유가 궁금합니다. `[.default`(p2, , 1)에서 다음과 같은 에러가 발생했습니다:incorrect number of dimensions > 이런경우 어떻게 해결할지 문의합니다.
- 미해결빅데이터분석기사 실기대비 (R 활용)
(오류) 섹션5 - 작업유형 1 오류 입니다
안녕하세요, 다음과 같이 코드를 실행했을 때 Cabin과 Embarked 값이 이상하게 나옵니다. 잘못된 부분 수정 부탁 드립니다
- 미해결빅데이터분석기사 실기대비 (R 활용)
실습 데이터 받을 수 있는지요
강의 자료, 기출 문제 와 연습 문제 실습데이터 다운 받을 수 있는지요
- 미해결빅데이터분석기사 실기대비 (R 활용)
이상치 유무 판단
실습에서 이상치 유무를 판단하는것은 최대, 최소값을 통해 파악한 건지요??
- 미해결빅데이터분석기사 실기대비 (R 활용)
실기시험 업데이트
빅데이터 분석기사 3회 실기시험이 진행되었는데요. 이거 업데이트를 요청드립니다. 후기를 보니 2회 시험문제보다 많이 어려웠다고 하는데요.