• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

data leakage에 대해 여쭈어봅니다

22.01.13 10:04 작성 조회수 191

0

 
apps['APPS_EXT_SOURCE_MEAN'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].mean(axis=1)
apps['APPS_EXT_SOURCE_STD'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].std(axis=1)
 
apps는 train과 test셋을 병합하여 만든 데이터셋인데, 평균으로 매꾸면 data leakage가 맞을까요?

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

그렇게 볼수도 있을것 같습니다. 음,, 이점을 간과했군요.  data leakage 부분을 보완해서 다시 테스트 해봐야 겠군요. 

좋은 지적 감사합니다. 

읽어봐주셔서 감사합니다! 그래도 저는 다음 강의는 교수님의 딥러닝 강의를 수강할 겁니다 :)

감사합니다. ^^