inflearn logo
강의

Course

Instructor

Kaggle Advanced Machine Learning Practical Crash Course

card_bal 데이터셋 시각화 관련 질문입니다

231

choemyeonggeun

9 asked

0

그래프.pngdistplot의 바, 곡선 모두 밀도를 의미한다고 알고 있는데 0과 가까운 곳에서 바는 빨간색, 곡선은 파란색이 더 높은데 이 경우는 빨간색과 파란색 중 어느 데이터가 0과 가까운 곳에서 밀도가 높은 것인가요 ?

머신러닝 kaggle

Answer 1

0

dooleyz3525

안녕하십니까,

오, 무척 예리하게 차트를 보셨군요.

제 생각엔 파란색이 0에 가까운 쪽에 좀 더 밀도가 높은 것 같습니다. 지금 bin 기반의 histogram 만으로 봤을 때는 빨간색이 더 0에 가까운 쪽에 밀도가 높아 보일 수 있는데, 아마도 bin의 크기가 커서 그렇게 보이는 것 같습니다. bin의 크기가 지금 보다 훨씬 작으면(그러니까 bin의 갯수가 많으면) 아마 histogram으로도 파란색이 0에 가까운 쪽에서 밀도가 높아 보일 것 같습니다.

감사합니다.

sql사용

0

46

2

좋은 강의 감사드립니다.

0

73

2

8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문

0

246

2

사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다

0

601

1

안녕하세요 선생님

0

228

1

권철민교수님 진심으로 감사드립니다.

0

319

1

안녕하세요 선생님

0

351

1

# credit_card_balance 데이터셋 피쳐엔지니어링

0

268

1

초거대 데이터셋을 Submission하려면?

0

190

1

Library 관련 질문

0

351

3

최적화 함수 에러

0

589

4

LightGBM Iteration관련

0

423

2

안녕하세요 교수님 vm 관련해서 질문이 있습니다.

0

204

1

코드를 실행했는데 오류가 발생합니다

0

1981

2

bayes_opt 회귀 모델에 적용하려면..

0

267

1

타겟값의 로그변환에 대해서

0

781

1

아나콘다 환경설정

0

460

1

깃허브 주소 문의드립니다.

0

360

1

손실함수에 대한 질문

0

344

1

LGBM null값 처리에 관해 질문있습니다

0

540

1

컬럼 관련 질문

0

281

1

히스토그램 x 값

0

365

1

n_iter 횟수 넘음 질문

0

492

2

학습데이터 테스트데이터 분리

0

324

1