inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

캐글 Advanced 머신러닝 실전 박치기

NULL 처리 관련 질문입니다.

322

Jaemin Kim

작성한 질문수 3

0

안녕하세요, 강의 너무 잘 들었습니다.

이번 강의에서는 LightGBM 만 썼는데, 나중에 XGBoost나 랜덤 포레스트 같은 다른 알고리즘을 쓰고 스태킹을 고려한다면, 다른 알고리즘 쓸 때 Null은 그냥 아무 숫자나 할당하면 되려나요? LightGBM은 Null을 알아서 분류한다고 하셔서 다른 것을 쓸때는 어떤식으로 하면 좋을 지 궁금해서 질문 올려봅니다.

감사합니다.

머신러닝 배워볼래요? kaggle

답변 1

1

권 철민

안녕하십니까,

일단 XGboost 역시 Null을 자체 처리 할 수 있습니다. 하지만 다른 사이킷런 GBM은 Null 값을 다른 값으로 대체 해주셔야 합니다. 여러가지 대체 기준이 있을 수 있지만, 간단하게 아래와 같은 기준을 적용해 볼수 있습니다.

1. 특정 컬럼에 Null값이 대부분이면 아예 해당 컬럼 삭제를 고려

2. 연속형 feature에 Null값이 많을 경우 평균값으로 일괄 대체 하거나, 특정값(예를 들어 -999)으로 대체 고려

3. 카테고리 feature에 Null이 많을 경우는 새로운 category 값으로 대체 또는 가장 많은 category값으로 통합 고려.

감사합니다.

0

Jaemin Kim

빠른 답변 감사드립니다!

sql사용

0

43

2

좋은 강의 감사드립니다.

0

72

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

596

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

267

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

350

3

최적화 함수 에러

0

587

4

LightGBM Iteration관련

0

422

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

203

1

코드를 실행했는데 오류가 발생합니다

0

1980

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

779

1

아나콘다 환경설정

0

459

1

깃허브 주소 문의드립니다.

0

358

1

손실함수에 대한 질문

0

342

1

card_bal 데이터셋 시각화 관련 질문입니다

0

230

1

LGBM null값 처리에 관해 질문있습니다

0

536

1

컬럼 관련 질문

0

278

1

히스토그램 x 값

0

362

1

n_iter 횟수 넘음 질문

0

484

2