인프런 커뮤니티 질문&답변

choemyeonggeun님의 프로필 이미지
choemyeonggeun

작성한 질문수

캐글 Advanced 머신러닝 실전 박치기

LGBM null값 처리에 관해 질문있습니다

작성

·

452

0

안녕하세요 머신러닝 완벽가이드부터 차례대로 수강 중인 학생입니다

LGBM이 NULL값을 자동으로 처리하여 분류한다고 말씀하셔서 NULL값을-999로 변환하지 않고 캐글에 제출해보았는데 성능이 많이 차이가 나서 질문 드립니다 !

NULL값을 -999로 변경했을 경우 private가 0.74022,

변경하지 않았을 경우 0.5736이 나왔는데 혹시 이유가 있을까요 ?

그리고 NULL값을 -999로 처리하신 이유가 궁금합니다 !

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

음, LGBM에서 Null을 자동으로 처리한것과, -999로 변환한 데이터로 처리 했을때의 모델 성능은 거의 대부분 차이가 없습니다. 차이가 있을 수는 있지만 미비한 수준이며 말씀한 수준으로 차이가 나는 경우는 없을 것입니다.

제가 -999로 변환하지 않고 그냥 null 값을 가진 데이터로 다시 학습해 봐도 둘다 0.74대로 큰 차이가 없습니다.

혹 코드에서 뭔가 다른 변경이 되었는지 다시 한번 확인 부탁드립니다.

그리고 -999로 변환한 특별한 이유는 없습니다. 기존에 있는 값이 아닌 아무 값이나 넣어주셔도 무방할 것 같습니다.

감사합니다.

choemyeonggeun님의 프로필 이미지
choemyeonggeun

작성한 질문수

질문하기