• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

교차 검증시 검증데이터와 훈련데이터의 중복?

20.12.26 18:40 작성 조회수 188

2

선생님 안녕하세요!
선생님 강의를 다 결제한 학생이에욥!

일단 문제 상황을 가정해볼께요.
예를 들어 3 폴드로 진행한다면
모델의 인스턴스 생성후
1번째
1,2 훈련
3 검증
2번째
1,3 훈련
2 검증
2,3, 훈련
1 검증
이렇게 진행하는 것으로 알고 있습니다. 

여기서 궁금한 점이 있습니다 
1번째는 훈련시 1,2훈련하고 3검증할때는 상관없지만,
그 이후인
2번째와 3번째의 검증셋인 각각 1,2집합은 이미 첫번째에 훈련데이터에 속해 있지 않나요? 그 훈련 값이 이미 훈련되어 있는데 검증할 때 영향이 또는 상관이 없을까요?
모델을 재생성하지 않아도 fit() 훈련할 때 마다 이전에 훈련된 것은 새롭게 초기화 되는건가요?

크리스마스 잘보내세요!

답변 1

답변을 작성해보세요.

2

안녕하십니까,

아이고, 제 강의를 모두 선택하셨다니, 감사합니다.

일반적으로 clf = DecisionTreeClassifier() 로 Estimator 객체를 만든 후에 fit()을 호출하면 학습을 합니다.  그리고 다시 fit()을 하면 이전에 훈련된것은 새롭게 초기화 됩니다.

말씀하신대로 clf = DecisionTreeClassifier()를 재 생성하지 않아도 fit() 훈련할 때 마다 훈련 데이터로 새롭게 초기화 되므로 문제가 없습니다.

크리스마스 연휴 잘 보내시길..

감사합니다.