• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

머신러닝에서 의사결정나무와 XGBOOST를 무시하고 랜덤포레스트만 돌리고 제출할려고 하는데 에러가 납니다.

24.05.30 23:13 작성 조회수 100

0

제목 그대로 랜포만 돌리고 제출할려고 하는데 array length 2931 does not match index length 3257 에러 메세지가 뜹니다.

코딩의 어느 부분이 잘못되었는지 감을 못잡겠습니다.

알려주시면 감사하겠습니다.

답변 1

답변을 작성해보세요.

0

X_val 예측결과를 제출해서 그렇습니다. 검증데이터는 학습자가 임의로 만든 데이터이지 문제에서 예측하고자 하는데이터는 아니에요!

문제에서 원하는건 X_val가 아니라 test 데이터의 예측결과에요! 따라서 최종 test데이터를 예측(predict_proba)하고, 제출해야 합니다. 코드를 잘 살펴봐주세요!

 

 

작업형2에가 가장 많이 하는 실수이고

이 실수로 인해 시험환경에서는 에러가 발생하지 않고 제출되어 0점처리됩니다.

에러내용은 id와 예측한 결과의 수가 맞지 않아요!

(시험에서 에러가 발생하지 않는건 최근에는 id를 포함하지 않고 예측결과만 제출하거든요)

 

 

shydrinker님의 프로필

shydrinker

질문자

2024.06.03

감사합니다. 아직 이해가 부족한 모양입니다. 코드 잘 살펴 보겠습니다. 건강하세요~

채널톡 아이콘