• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

randomforest 질문

20.05.31 22:05 작성 조회수 74

0

randomforest 강의 2분 40초 쯤에서 

for(k in 1:10){

코딩생략

acc2[k]<-acc[length(acc)] 

인데 

왜 acc의 마지막 부분을 acc2로 선택하나요?ㅜㅜ

저것마저 평균을 내야 하는거 아닌가요?

답변 1

답변을 작성해보세요.

0

안녕하세요. shinym67 님

해당 코드를 보시면

예측한 값들을 누적해서 pred_list에서 넣었고

pred1값은 지금까지 누적한 예측값을 통해 최종적으로 예측한 값입니다.

pred1값을 acc[i]에 넣었기 때문에 i를 100번 돌리게 되면, 100번째 있는 값이 

최종적으로 모든 예측값을 ensemble한 값이 됩니다.

    pred_list<-rbind(pred_list,pr[,2])    

    pred1<-apply(pred_list,2,mean)

 acc<-c()

  for(i in 1:100){

    

......

    pred_list<-rbind(pred_list,pr[,2])    

    pred1<-apply(pred_list,2,mean)

    ## accuracy 

    pred<-ifelse(pred1 > 0.5,"present","absent")

    acc[i]<-sum(kyphosis$Kyphosis[-sam] ==pred)/length(pred) 

    ts.plot(acc)

  }