• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

예시문제 작업형2번

23.05.11 14:19 작성 23.05.12 20:52 수정 조회수 293

0

안녕하세요

전처리를 할 때 bagImpute 로 결측치 처리를 전체 했더니, auc >1 로 나오는데
이 경우에는 하신 대로 mean 평균으로 대체하는게 맞을까요?

 scale(데이터, center=TRUE, scale=TRUE) 대신에 preProcess (caret 패키지) 를 추천해주신 이유가 있으실까요?

답변 1

답변을 작성해보세요.

1

안녕하세요.

bagImpute로 전처리 하신 부분은 제가 보내주신 것만으로 확인이 어렵습니다.

다만, auc가 1이 넘은 것으로 봐서 제대로 동작하지 않은 것으로 보입니다.

 

시험을 거듭할 수록 느끼는 점은 굳이 bagImpute를 사용할 필요없이 mean이나 median으로

결측치를 처리하는 것이 나아보입니다. 아니면 0으로 처리하는 방법도 있습니다.

그리고 상황에 따라서는 굳이 처리하지 않아도 될 것 같습니다.

이 부분은 정말 데이터와 상황에 맞게 대처하시면 좋을 것 같습니다.

 

scale함수 대신 caret package의 함수를 추천드린 것은

caret package하나로 전체 문제를 접근하는 일관성 관점에서 설명을 드리기 위해서 선택했습니다.

특별히 문제가 되는 점은 없으니 편하신대로 사용하시면 좋을 것 같습니다.

 

감사합니다.