apps['APPS_EXT_SOURCE_MEAN'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].mean(axis=1)
apps['APPS_EXT_SOURCE_STD'] = apps[['EXT_SOURCE_1','EXT_SOURCE_2','EXT_SOURCE_3']].std(axis=1)
apps는 train과 test셋을 병합하여 만든 데이터셋인데, 평균으로 매꾸면 data leakage가 맞을까요?
읽어봐주셔서 감사합니다! 그래도 저는 다음 강의는 교수님의 딥러닝 강의를 수강할 겁니다 :)