• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

모델 구축관련

21.12.01 22:41 작성 조회수 94

0

factor 는 아예 제외하고 모델을 만들었는데 실제로 채점할 때는 제외했던 factor를 포함해서 평가하고 채점하는거아닌가요?

그럼 제외하고 평가했던 0.64 보다 많이 낫게 나오나요?

factor까지 포함한 전체 데이터로 평가를 안해봐도 되는걸까요?

답변 1

답변을 작성해보세요.

1

안녕하세요. 실제로 채점은 제출하신 csv의 확률값과 진흥원이 가지고 있는 정답지를 통해서 채점합니다.

따라서 변수의 유무는 진흥원에서 알 수 없습니다. 결국 csv만 보고 채점하기 때문이죠.

 

말씀드린바와 같이 factor의 숫자가 모델을 돌리기 적합하면 넣고 돌리지만 너무 많아서 뭔가

처리를 해주어야하는 상황일 경우에만 버리는 방법입니다. 몇 가지 데이터셋에 실험해보았지만

굳이 하지 않더라도 엄청 낮은 평가결과가 나오지는 않습니다. 말씀드린바와 같이 전략은

어느정도의 성능을 1분내 코드로 실행시켜서 만점이 아니더라도 시험에 합격하는 것이기 때문입니다.

 

변수를 선택하는 것도 시험의 일부이고 응시자의 자유이기 때문에 factor형 변수 혹은 다른 변수를 

제외해도 최종 성적평가와 무관합니다.