• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

df의 히스토그램 관련 질문

21.04.27 23:16 작성 조회수 143

1

안녕하세요, 선생님

강의 잘 듣고 있습니다.

다름이 아니라 처음에

df.hist() 만으로

df['ListingYear']와 같은 결과값이 나왔는데 이유를 알 수 있을까요?

df['ListingYear']를 애초에 추가 안해줬으면 error가 나오더라구요.

그래서 전체 dataframe에다가 hist method를 쓰면

column 기준으로 히스토그램을 그리는지 궁금합니다.

감사합니다.

답변 1

답변을 작성해보세요.

0

안녕하세요. 

히스토그램은 수치데이터의 빈도수를 표현해 주는 그래프이기 때문에 수치데이터가 없다면 시각화를 할 수가 없어요. 그래서 수치변수가 없을때는 오류가 발생해요.

df.hist() 에서 "ListingYear"라는 파생변수가 없다면 수치 데이터가 없기 때문에 히스토그램을 그리려 했을 때 그릴 수 있는 변수가 없기 때문에 오류가 발생했을거에요. 그런데 "ListingYear" 라는 수치데이터의 파생변수를 생성해 주었기 때문에 히스토그램을 그릴 수 있게 되어 히스토그램이 그려졌을거에요.

그래서 질문해 주신대로 전체 데이터프레임에 hist()를 호출하면 전체 컬럼(변수)에서 수치 데이터를 모두 찾아서 히스토그램을 그립니다.

다른 수업에서 df.hist()를 통해 여러 종목에 대해 히스토그램을 그리기도 하는데요.

(3.2) 여러 종목 수익률 비교 수업의 [3/3] 여러 종목 수익률 비교하기 를 들어보시면 이해하시는데 좀 더 도움이 될것 같아요. 

감사합니다!