-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
data leakage에 대해 여쭈어봅니다
22.01.13 10:04 작성 조회수 198
0
apps['APPS_EXT_SOURCE_MEAN'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].mean(axis=1)
apps['APPS_EXT_SOURCE_STD'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].std(axis=1)
apps는 train과 test셋을 병합하여 만든 데이터셋인데, 평균으로 매꾸면 data leakage가 맞을까요?
답변을 작성해보세요.
1
권 철민
지식공유자2022.01.13
안녕하십니까,
그렇게 볼수도 있을것 같습니다. 음,, 이점을 간과했군요. data leakage 부분을 보완해서 다시 테스트 해봐야 겠군요.
좋은 지적 감사합니다.
답변 1