card_bal 데이터셋 시각화 관련 질문입니다
231
9 asked
distplot의 바, 곡선 모두 밀도를 의미한다고 알고 있는데 0과 가까운 곳에서 바는 빨간색, 곡선은 파란색이 더 높은데 이 경우는 빨간색과 파란색 중 어느 데이터가 0과 가까운 곳에서 밀도가 높은 것인가요 ?
Answer 1
0
안녕하십니까,
오, 무척 예리하게 차트를 보셨군요.
제 생각엔 파란색이 0에 가까운 쪽에 좀 더 밀도가 높은 것 같습니다. 지금 bin 기반의 histogram 만으로 봤을 때는 빨간색이 더 0에 가까운 쪽에 밀도가 높아 보일 수 있는데, 아마도 bin의 크기가 커서 그렇게 보이는 것 같습니다. bin의 크기가 지금 보다 훨씬 작으면(그러니까 bin의 갯수가 많으면) 아마 histogram으로도 파란색이 0에 가까운 쪽에서 밀도가 높아 보일 것 같습니다.
감사합니다.
sql사용
0
46
2
좋은 강의 감사드립니다.
0
73
2
8분 40초경 LGBClassifier에서 설정해주신 파라미터들 관련 질문
0
246
2
사용 가능한 RAM을 모두 사용한 후 세션이 다운되었습니다
0
601
1
안녕하세요 선생님
0
228
1
권철민교수님 진심으로 감사드립니다.
0
319
1
안녕하세요 선생님
0
351
1
# credit_card_balance 데이터셋 피쳐엔지니어링
0
268
1
초거대 데이터셋을 Submission하려면?
0
190
1
Library 관련 질문
0
351
3
최적화 함수 에러
0
589
4
LightGBM Iteration관련
0
423
2
안녕하세요 교수님 vm 관련해서 질문이 있습니다.
0
204
1
코드를 실행했는데 오류가 발생합니다
0
1981
2
bayes_opt 회귀 모델에 적용하려면..
0
267
1
타겟값의 로그변환에 대해서
0
781
1
아나콘다 환경설정
0
460
1
깃허브 주소 문의드립니다.
0
360
1
손실함수에 대한 질문
0
344
1
LGBM null값 처리에 관해 질문있습니다
0
540
1
컬럼 관련 질문
0
281
1
히스토그램 x 값
0
365
1
n_iter 횟수 넘음 질문
0
492
2
학습데이터 테스트데이터 분리
0
324
1

