inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

캐글 Advanced 머신러닝 실전 박치기

OOF(Out Of Prediction) 개요

OOF Prediction 개념에 대해서

839

jhdia

작성한 질문수 11

1

안녕하세요 OOF Prediction에 대한 개념을 제가 제대로 이해했는지 궁금해서 질문을 올려봅니다

1. OOF Prediction이라는 것은 K-Fold를 통해서 학습 데이터셋을 학습 세트와 검증 세트로 나누고, 검증 세트은 버리고 학습 세트만 사용하여 K번씩 각기 다른 종류의 모델들 혹은 동일한 종류의 모델을 생성한 다음 생성된 K개의 모델을 동일한 테스트 데이터에 적용시켜서 예측값을 내놓은 뒤 그 예측값을 평균내는 방법인가요?

2. 인터넷에 검색해보면 OOF Prediction말고도 OOF ensemble이라는 말도 있던데, OOF ensemble은 학습 폴드세트로 학습된 K개 모델들이 서로 다른 OOF Prediction을 말하는 건가요?(2번 질문이 수업 내용에 벗어난거라면 죄송합니다)   

kaggle 머신러닝 배워볼래요?

답변 1

0

권 철민

안녕하십니까,

1. 네 정확히 맞습니다. k fold 방식으로 학습한 모델로 여러번 예측한 뒤 그 예측값을 평균하는 방식입니다.

2. 보통은 oof ensemble을 stacking이라고 합니다. 이게 OOF Prediction하고 다른게, K fold 방식으로 학습해서 validation으로 예측을 하는데, 이 예측 결과를 기반으로 별도의 학습 데이터를 다시 만든 다음, 이 학습데이터로 또 학습하여 예측을 합니다. 인터넷 검색을 해보니 아래에 보다 자세하게 설명이 되어 있습니다(물론 파이썬 머신러닝 완벽 가이드 4장 분류의 마지막 부분에 더 자세하게 설명은 되어 있습니다)

https://ekdud7667.tistory.com/entry/Ensemble-%EA%B0%9C%EC%9A%94Bagging-Boosting-Stacking

감사합니다.

sql사용

0

45

2

좋은 강의 감사드립니다.

0

73

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

599

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

267

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

350

3

최적화 함수 에러

0

589

4

LightGBM Iteration관련

0

422

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

203

1

코드를 실행했는데 오류가 발생합니다

0

1981

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

779

1

아나콘다 환경설정

0

459

1

깃허브 주소 문의드립니다.

0

359

1

손실함수에 대한 질문

0

342

1

card_bal 데이터셋 시각화 관련 질문입니다

0

230

1

LGBM null값 처리에 관해 질문있습니다

0

538

1

컬럼 관련 질문

0

280

1

히스토그램 x 값

0

364

1

n_iter 횟수 넘음 질문

0

489

2