inflearn logo
강의

Course

Instructor

Kaggle Advanced Machine Learning Practical Crash Course

LGBM null값 처리에 관해 질문있습니다

536

choemyeonggeun

8 asked

0

안녕하세요 머신러닝 완벽가이드부터 차례대로 수강 중인 학생입니다

LGBM이 NULL값을 자동으로 처리하여 분류한다고 말씀하셔서 NULL값을-999로 변환하지 않고 캐글에 제출해보았는데 성능이 많이 차이가 나서 질문 드립니다 !

NULL값을 -999로 변경했을 경우 private가 0.74022,

변경하지 않았을 경우 0.5736이 나왔는데 혹시 이유가 있을까요 ?

그리고 NULL값을 -999로 처리하신 이유가 궁금합니다 !

머신러닝 kaggle

Answer 1

0

dooleyz3525

안녕하십니까,

음, LGBM에서 Null을 자동으로 처리한것과, -999로 변환한 데이터로 처리 했을때의 모델 성능은 거의 대부분 차이가 없습니다. 차이가 있을 수는 있지만 미비한 수준이며 말씀한 수준으로 차이가 나는 경우는 없을 것입니다.

제가 -999로 변환하지 않고 그냥 null 값을 가진 데이터로 다시 학습해 봐도 둘다 0.74대로 큰 차이가 없습니다.

혹 코드에서 뭔가 다른 변경이 되었는지 다시 한번 확인 부탁드립니다.

그리고 -999로 변환한 특별한 이유는 없습니다. 기존에 있는 값이 아닌 아무 값이나 넣어주셔도 무방할 것 같습니다.

감사합니다.

sql사용

0

44

2

좋은 강의 감사드립니다.

0

73

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

597

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

267

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

350

3

최적화 함수 에러

0

587

4

LightGBM Iteration관련

0

422

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

203

1

코드를 실행했는데 오류가 발생합니다

0

1981

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

779

1

아나콘다 환경설정

0

459

1

깃허브 주소 문의드립니다.

0

358

1

손실함수에 대한 질문

0

342

1

card_bal 데이터셋 시각화 관련 질문입니다

0

230

1

컬럼 관련 질문

0

278

1

히스토그램 x 값

0

362

1

n_iter 횟수 넘음 질문

0

484

2

학습데이터 테스트데이터 분리

0

321

1