• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

preProcess 함수 적용하는 개념

22.06.17 04:19 작성 조회수 187

0

preProcess 함수 적용하는 개념을 잘 모르겠습니다. 

model1, model2 등 모델을 생성하기전에 preProcess 함수를 사용하여 진행하는 과정을 간단하게 예를들어주시면 감사하겠습니다. 

그리고 최근 질문 이전 질문에 대한 답변도 참고하고 싶은데

확인할 수 있는 경로 부탁드립니다. 

답변 2

·

답변을 작성해보세요.

0

ckddn60님의 프로필

ckddn60

질문자

2022.06.18

자세한 설명 감사합니다.

0

 

안녕하세요. 제가 수강생으로 들어가보니 '대시보드'라는 메뉴가 있고

그 '대시보드'에서 최근강의공지, 내학습상황, 최근질문 등을 볼 수 있습니다.

 

preProcess 함수를 모델을 만드는 것이라고 생각하시면 좋을 것 같습니다.

표준화, 정규화 등을 수행하는 방법인데 그걸 모델처럼 이용하는 개념으로 생각하시면 되겠습니다.

예시로 이미 스크립트를 드렸지만 객체명을 조금 바꿔보겠습니다.

 

library(caret)

df <- iris

preProcess_model <- preProcess(df, method  =  c("center","scale"))

df_scale <- predict(preProcess_model, df)

head(df_scale)

 

이렇게 모델을 만들고 predict하면 새로운 데이터가 나오는 개념으로 이해해주시면 좋을 것 같습니다.

이후에 모델을 만드는 절차는 아예 동일합니다.

inx <- createDataPartition(df_scale$Species, p=0.7, list=F)

train <- df_scale[inx,]

test <- df_scale[-inx,]

model1 <- train(Species~. , data = train, method = 'rpart')

p1 <- predict(model1, test, type = 'prob')

p1

 

이렇게 이후 과정을 동일합니다. 위의 스크립트와 비교해보셔도 알겠지만

preProcess함수의 개념을 모델을 만든다라는 개념으로 접근하시면 좀 더 이해가 쉬우실 것 같습니다.

감사합니다.