인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

슈베토벤님의 프로필 이미지
슈베토벤

작성한 질문수

캐글 Advanced 머신러닝 실전 박치기

data leakage에 대해 여쭈어봅니다

작성

·

247

0

 
apps['APPS_EXT_SOURCE_MEAN'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].mean(axis=1)
apps['APPS_EXT_SOURCE_STD'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].std(axis=1)
 
apps는 train과 test셋을 병합하여 만든 데이터셋인데, 평균으로 매꾸면 data leakage가 맞을까요?

답변 1

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

그렇게 볼수도 있을것 같습니다. 음,, 이점을 간과했군요.  data leakage 부분을 보완해서 다시 테스트 해봐야 겠군요. 

좋은 지적 감사합니다. 

슈베토벤님의 프로필 이미지
슈베토벤
질문자

읽어봐주셔서 감사합니다! 그래도 저는 다음 강의는 교수님의 딥러닝 강의를 수강할 겁니다 :)

권 철민님의 프로필 이미지
권 철민
지식공유자

감사합니다. ^^

슈베토벤님의 프로필 이미지
슈베토벤

작성한 질문수

질문하기