-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
LGBM null값 처리에 관해 질문있습니다
23.05.28 13:16 작성 조회수 333
0
안녕하세요 머신러닝 완벽가이드부터 차례대로 수강 중인 학생입니다
LGBM이 NULL값을 자동으로 처리하여 분류한다고 말씀하셔서 NULL값을-999로 변환하지 않고 캐글에 제출해보았는데 성능이 많이 차이가 나서 질문 드립니다 !
NULL값을 -999로 변경했을 경우 private가 0.74022,
변경하지 않았을 경우 0.5736이 나왔는데 혹시 이유가 있을까요 ?
그리고 NULL값을 -999로 처리하신 이유가 궁금합니다 !
답변을 작성해보세요.
0
권 철민
지식공유자2023.05.29
안녕하십니까,
음, LGBM에서 Null을 자동으로 처리한것과, -999로 변환한 데이터로 처리 했을때의 모델 성능은 거의 대부분 차이가 없습니다. 차이가 있을 수는 있지만 미비한 수준이며 말씀한 수준으로 차이가 나는 경우는 없을 것입니다.
제가 -999로 변환하지 않고 그냥 null 값을 가진 데이터로 다시 학습해 봐도 둘다 0.74대로 큰 차이가 없습니다.
혹 코드에서 뭔가 다른 변경이 되었는지 다시 한번 확인 부탁드립니다.
그리고 -999로 변환한 특별한 이유는 없습니다. 기존에 있는 값이 아닌 아무 값이나 넣어주셔도 무방할 것 같습니다.
감사합니다.
답변 1