• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

train / test 구분하여 생기는 문제에 대해서

22.05.08 01:15 작성 조회수 123

1

user_profile에 저장한 intercept와 coefficient 값들은 train 데이터셋을 통해서 얻었기때문에, test셋에 있는 user가 train set에는 없는 경우가 있을 수 있을 것 같은데 이렇게하면, user_profile.loc[user] 라는 코드는 존재하지 않는 index에 대한 참조가 되기에 Key Error가 발생할 것으로 보입니다.

이를 미리 확인해보고 싶은데, Key Error를 미리 확인하는 방법을 못찾겠네요...  이를 확인하는 코드와 처리하는 방법이 궁금해요

 

 

 

그리고 

답변 1

답변을 작성해보세요.

0

안녕하세요 이원석님,

파이썬의 try, except 구문을 이용하여 에러가 나는 유저의 경우에 따로 처리를 할 수 있는 로직을 만들어 보강하는 방법이 있을 것 같습니다. try, except 구문은 아래 문서를 참고해주세요.

  • 점프 투 파이썬, 예외처리 방법: https://wikidocs.net/30

 

그리고 test 데이터에는 유저가 있지만, train 데이터에는 없는 경우를 cold-start 문제라고 부르며 해결 방법에 대해서는 [아이디어 설명] Cold-Start 문제를 해결하려면? 강의를 참고해주세요.

답변이 늦어져 죄송합니다.

 

좋은 질문 감사합니다!