• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

seaborn을 이용한 barplot이 왜 확률을 보여주게 되는지 궁금합니다.

22.01.23 11:40 작성 조회수 147

0

안녕하세요. 

강의를 듣는 중에 궁금한 점이 있어서 질문드리려 합니다. 

`sns.barplot(x='Sex', y='Survived', data=titanic_df)` 를 실행시키면 결과로 x 축에는 성별이, y축에는 생존률이 나오는데요. 사실 비율보다는 인원수가 나오는 게 자연스럽지 않을까 생각했는데 혹시 왜 이런지 알 수 있을까요? 뭐 구현이 그렇게 되었으니 이렇게 나오는 거라고 생각하고 넘어갈 수도 있겠습니다만, 왜 이런 식으로 구현이 된 것인지 궁금하네요. 

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

그러고 보니 barplot에 bar가 count를 의미하는게 직관적일 수도 있겠군요. 

하지만 count자체를 의미하면 사실 y 축 값이 필요없다고도 생각됩니다. x값이 Sex 니까 Male , Femal 건수만을 시각화하면 y축 값이 될 것 같습니다. 

어쩧든 seaborn의 barplot은 건수가 아니라, x축 값에 따른 y축 값의 중심값을 표현하는데 사용됩니다.  즉 x축 값 Male일때 y축값 survived의 중심값을 나타냅니다. survived가 0과 1로 되어 있기 때문에 자연스럽게 y축 값이 확률로 나타날 뿐입니다. 

때문에 seaborn의 barplot은 x축 또는 y축 값은 반드시 숫자값으로 되어야 합니다. 

감사합니다.