강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của hyeon05281244
hyeon05281244

câu hỏi đã được viết

Kaggle Advanced Machine Learning thực hành

application 데이터 세트 주요 피처 EDA thực hiện - 03(tương quan và Heatmap)

주요 컬럼의 선택하신것에 대한 질문.

Viết

·

262

0

선생님 안녕하세요,

주요컬럼들을 미리 list로 만들어 놔 주셨는데, 

이는 LGBM에서 importance순으로 가져온 것인지요(조금은 상이하기에..) 아니라면 어떻게 '주요하다'라고 선택된 칼럼들인지요 ??

kaggle머신러닝 배워볼래요?

Câu trả lời 2

0

hyeon05281244님의 프로필 이미지
hyeon05281244
Người đặt câu hỏi

답변감사합니다. feature selection에 대해 머신러닝완벽가이드 에서 추가되어 있었군요 . 보겠습니다 ㅎ

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Người chia sẻ kiến thức

안녕하십니까,

앞의 Target 값 별 연속형 숫자 feature들의 histogram 시각화 할때 두드러진 feature들만 별도로 추출해서 주요 컬럼으로 만들었습니다. EXT_SOURCE관련, 대출 금액 관련, 연령, 취업기간, 소득, 그리고 추가적으로 TARGET 값에 따라 차이가 발생한 몇개의 feature들로 구성했고, 이들 feature들간의 상관도, 특히 target과의 상관도 정도를 알아보고자 하였습니다.

감사합니다.

Hình ảnh hồ sơ của hyeon05281244
hyeon05281244

câu hỏi đã được viết

Đặt câu hỏi