inflearn logo
강의

講義

知識共有

ビッグデータ分析記事実技コントラスト(R活用)

作業型2タイプ

제4회 작업형2 실기 질문입니다.

283

rednugoori6548

投稿した質問数 14

0

모델을 만들고 예측해서 rpart모델을 최종 파이널로 만들때

model_f <- train(Segmentation~. , data = df, method = 'rpart')

p_f <- predict(model_f, tst)

게 하고

cm_f<- confusionMatrix(p_f,tst$Segmentation)

mean(cm_f$byClass[,7], na.rm = T)

를 안 하는 이유는 tst파일에 Segmentation변수가 없기 때문인가요?(해보면 에러가 뜨긴 하는데...)

결국 위에서 모델을 만들고 예측을 한 다음 최종적으로 제출파는 파일에는 예측변수가 없기 때문에 p_f만 제출하면 되는 거죠?

 

 

bigdata

回答 2

1

rednugoori6548

선생님!!

친절하시고 자세하신 설명 덕분에 코드 이해했습니다.

감사합니다.!!!

0

companionclub

 

안녕하세요.

네 맞습니다. 그 변수가 없습니다.

그 변수는 답안지이고 진흥원에서 가지고 있으며 제출하신 예측값과 비교를 합니다.

그래서 위에 쓰신 그 코드는 우리가 아닌 진흥원에서 사용해서 평가합니다.

 

기본적으로 진흥원에서는 답지가 있는 (y가 있는) 데이터와 그렇지 않은 데이터를 줍니다.

그러면 우리는 답지가 있는 데이터를 활용해서 모델을 만들고 그렇지 않은 데이터를 모델에 투입해서

그 결과를 답지로 제출합니다.

 

그런데 답지가 있는 데이터로 모델을 만들 때, 그 모델이 잘 만들어졌는지 궁금하기 때문에

그 데이터를 train/test로 나누어서 평가를 해보는 과정을 거칩니다.

 

그 과정이 부담스럽거나 모델을 하나밖에 모른다면 나누어서 평가하는 과정도 필요없고

그냥 전체 데이터를 다 넣어서 모델을 만들고 답지가 없는 데이터를 모델에 투입해서 예측값을

제출하면 됩니다.

 

그러나 대부분의 서적이나 강의에서 그렇게 하지않고

그래도 한번쯤은 내가 만든 모델을 평가하는 과정을 거치도록 코딩했고 저도 마찬가지 입니다.

 

결론적으로 문의하신 부분이 맞으며 예측변수가 없기 때문에 평가를 우리가 할 수 없으며

p_f 변수의 예측값만 제출하면 됩니다.

마지막 질문이될것같습니다 선생님!!

0

292

1

5회 2유형

0

346

1

작업형제2유형 질문입니다.

0

422

1

rmse질문입니다.

0

339

1

제5회 빅데이터분석기사 실기 응시 가이드 질문입니다.

0

447

2

제4회 실기시험 리뷰 작업형2문제

0

418

2

출제예상문제풀이 1번 문제 질문입니다

0

287

1

제4회 실기시험 리뷰 작업형1에서 3번문제 질문입니다.

0

193

1

제4회 실기시험 리뷰 작업형1질문 1번문제

0

275

1

회귀모델구축 질문입니다.

0

282

2

작업형 2유형 질문

0

252

1

작업형 제2유형 질문입니다.

0

177

1

작업형제2유형 질문입니다.

0

231

2

제4회 작업형2 실기시험 질문입니다.

0

325

2

3회 작업형 1유형 전처리 문제

0

267

1

예상문제 작업2유형 샘플파일이 읽혀지지 않는 문제

0

300

3

실기4 유형2 질문

0

201

1

실기 3회 유형2 세부사항 문의

0

241

2

섹션 4 예상문제

0

195

1

열공중입니다 도와주세요 감사합니다!!

0

175

1

학습 질문있습니다!

0

231

1

덕분에 합격했습니다만..

0

175

1

덕분에 합격했습니다.

1

168

1

작업2유형 분류문제

0

400

2