inflearn logo
강의

講義

知識共有

ビッグデータ分析記事実技コントラスト(R活用)

예시문제 작업형2번

464

missmanager

投稿した質問数 1

0

안녕하세요

전처리를 할 때 bagImpute 로 결측치 처리를 전체 했더니, auc >1 로 나오는데
이 경우에는 하신 대로 mean 평균으로 대체하는게 맞을까요?

 scale(데이터, center=TRUE, scale=TRUE) 대신에 preProcess (caret 패키지) 를 추천해주신 이유가 있으실까요?

빅데이터

回答 1

1

companionclub

안녕하세요.

bagImpute로 전처리 하신 부분은 제가 보내주신 것만으로 확인이 어렵습니다.

다만, auc가 1이 넘은 것으로 봐서 제대로 동작하지 않은 것으로 보입니다.

 

시험을 거듭할 수록 느끼는 점은 굳이 bagImpute를 사용할 필요없이 mean이나 median으로

결측치를 처리하는 것이 나아보입니다. 아니면 0으로 처리하는 방법도 있습니다.

그리고 상황에 따라서는 굳이 처리하지 않아도 될 것 같습니다.

이 부분은 정말 데이터와 상황에 맞게 대처하시면 좋을 것 같습니다.

 

scale함수 대신 caret package의 함수를 추천드린 것은

caret package하나로 전체 문제를 접근하는 일관성 관점에서 설명을 드리기 위해서 선택했습니다.

특별히 문제가 되는 점은 없으니 편하신대로 사용하시면 좋을 것 같습니다.

 

감사합니다.

 

작업형 1 유형 부분

0

13

1

작업형 1 (삭제예정, 구 버전)

0

32

2

작업형 2유형 수업에서

0

122

2

작업형 3유형

0

106

1

작업형 1유형 코드 과정 및 답안

0

188

1

작업형2유형 rmse값

0

230

2

f1 스코어

0

139

2

작업 2유형 제출형식

0

114

2

작업형 2유형 인덱스값

0

117

2

이번시험 작업형2 질문

0

274

1

4회 작업형 2유형 문제 불러왔을 때 변수가 안보이는데요

0

220

1

작업형 1유형의 3번문제(ratio)

0

206

1

출제예상 문제 질문이요~

0

199

1

섹션 4 작업형 2유형 (16:29) 결과 추가 문의

1

387

2

predict.randomForest

1

532

1

비지도학습

0

341

1

predict함수 type 질문

0

551

1

이상치 처리시

0

405

1

작업2유형 - 4회 기출 질문 드립니다

0

404

1

dplyr 라이브러리의 select 함수를 궂이 써야하는 이유가 있을까요?

0

375

2

맨 마지막 p3에서 2,482명이 나와야 되는거 아닌가요???

0

567

3

가설검정결과 채택의 의미에 대해 의문사항이 있습니다!

1

452

2

6회 시험 실기유형 변경

0

314

2

작업2유형 분류문제

0

400

2