강의

멘토링

커뮤니티

Inflearn Community Q&A

hyeon05281244's profile image
hyeon05281244

asked

Kaggle Advanced Machine Learning Practical Crash Course

Application dataset key feature EDA - 03 (Correlation and Heatmap)

주요 컬럼의 선택하신것에 대한 질문.

Written on

·

260

0

선생님 안녕하세요,

주요컬럼들을 미리 list로 만들어 놔 주셨는데, 

이는 LGBM에서 importance순으로 가져온 것인지요(조금은 상이하기에..) 아니라면 어떻게 '주요하다'라고 선택된 칼럼들인지요 ??

kaggle머신러닝 배워볼래요?

Answer 2

0

hyeon05281244님의 프로필 이미지
hyeon05281244
Questioner

답변감사합니다. feature selection에 대해 머신러닝완벽가이드 에서 추가되어 있었군요 . 보겠습니다 ㅎ

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

앞의 Target 값 별 연속형 숫자 feature들의 histogram 시각화 할때 두드러진 feature들만 별도로 추출해서 주요 컬럼으로 만들었습니다. EXT_SOURCE관련, 대출 금액 관련, 연령, 취업기간, 소득, 그리고 추가적으로 TARGET 값에 따라 차이가 발생한 몇개의 feature들로 구성했고, 이들 feature들간의 상관도, 특히 target과의 상관도 정도를 알아보고자 하였습니다.

감사합니다.

hyeon05281244's profile image
hyeon05281244

asked

Ask a question