인프런 커뮤니티 질문&답변

hjhj4232님의 프로필 이미지
hjhj4232

작성한 질문수

캐글 Advanced 머신러닝 실전 박치기

application 데이터 세트 기본 분석과 시각화 - 02

히스토그램 x 값

작성

·

319

·

수정됨

0

안녕하세요. 현재 app_baseline01을 강의와 함께 같이 실습하고 있는 강의 수강생입니다..!

train 데이터의 AMT_INCOME_TOTAL의 값들은 아래의 사진과 같은데, 히스토그램 그래프에서 x 값들이 소수점으로 나오는 이유가 무엇인지 궁금합니다. 아래의 값들이 범위로 나눠져 나타나야 하는 것이 아닌가요? 소수점들이 의미하는 바가 무엇인지 궁금합니다!

항상 좋은 강의 제공해주셔서 감사합니다~!

 

 

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

X축값은 AMT_INCOME_TOTAL Bin 값이 맞습니다.

다만 AMT_INCOME_TOTAL 값이 커서, X축의 맨 마지막을 보시면 1e8 로 단위가 되어 있는 것을 확인하실 수 있을 겁니다. 특히 AMT_INCOME_TOTAL 값이 매우 큰값이 존재하기 때문에 10의 8승 단위로 x축값이 만들어 졌습니다.

Histogram 생성 시 bins의 갯수를 크게 늘려 보시거나, seaborn의 histplot()을 사용해 보시면 어떨까 싶습니다.

감사합니다.

hjhj4232님의 프로필 이미지
hjhj4232
질문자

답변감사합니다!~

hjhj4232님의 프로필 이미지
hjhj4232

작성한 질문수

질문하기