inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

캐글 Advanced 머신러닝 실전 박치기

application 데이터 세트 주요 피처 EDA 수행 - 03(상관도 및 Heatmap)

주요 컬럼의 선택하신것에 대한 질문.

279

이시현

작성한 질문수 14

0

선생님 안녕하세요,

주요컬럼들을 미리 list로 만들어 놔 주셨는데, 

이는 LGBM에서 importance순으로 가져온 것인지요(조금은 상이하기에..) 아니라면 어떻게 '주요하다'라고 선택된 칼럼들인지요 ??

kaggle 머신러닝 배워볼래요?

답변 2

0

이시현

답변감사합니다. feature selection에 대해 머신러닝완벽가이드 에서 추가되어 있었군요 . 보겠습니다 ㅎ

0

권 철민

안녕하십니까,

앞의 Target 값 별 연속형 숫자 feature들의 histogram 시각화 할때 두드러진 feature들만 별도로 추출해서 주요 컬럼으로 만들었습니다. EXT_SOURCE관련, 대출 금액 관련, 연령, 취업기간, 소득, 그리고 추가적으로 TARGET 값에 따라 차이가 발생한 몇개의 feature들로 구성했고, 이들 feature들간의 상관도, 특히 target과의 상관도 정도를 알아보고자 하였습니다.

감사합니다.

sql사용

0

45

2

좋은 강의 감사드립니다.

0

73

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

599

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

267

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

350

3

최적화 함수 에러

0

589

4

LightGBM Iteration관련

0

422

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

203

1

코드를 실행했는데 오류가 발생합니다

0

1981

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

780

1

아나콘다 환경설정

0

459

1

깃허브 주소 문의드립니다.

0

359

1

손실함수에 대한 질문

0

342

1

card_bal 데이터셋 시각화 관련 질문입니다

0

230

1

LGBM null값 처리에 관해 질문있습니다

0

538

1

컬럼 관련 질문

0

280

1

히스토그램 x 값

0

364

1

n_iter 횟수 넘음 질문

0

489

2