• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

선생님, 질문이 있습니다.

21.06.03 18:49 작성 조회수 130

1

선생님, 강의 잘 듣고 있습니다.

강의를 듣다가 궁금증이 생기는데

9/20 부터 15/20 즈음까지의 강의는 모두  

결국  seaborn 라이브러리 안에는 여러 개의 xxplot이 있다는걸 소개하는거고

곧 활용할 수 있는 api에는 이러이러한 것이 있다 고 설명하는 셈이잖아요?

헌데 이런걸 전부 외우는 현업 개발자는 없고 그분들도 필요나 설계에 따라 맞게 쓰는 정도로 활용하는 걸루 알고 있는데 

그래도 강의를 들으면서 최소한 숙지해야 하는 정도 라는게 있다면  어느 정도가 적절할는지 궁금합니다. 

참고로 저는 원래 자바랑 c++ 위주로 쓰는 주니어이고 파이썬으로는 알고리즘까지는 낯설어서 잘 쓰진 않지만 자료구조 구현은 할 줄 아는 정도입니다. 그리고  최근에 머신러닝 배우면서 이 강의는 캐주얼한 용도로 듣고 있습니다.  

감사합니다!

답변 1

답변을 작성해보세요.

0

안녕하세요.

좋은 질문을 주셨네요.

파이썬의 시각화 도구로는 여러가지가 있습니다. 여기에서는 주로 seaborn과 pandas를 사용하지만 plotly나 다른 도구들도 있죠.

질문해 주신 것처럼 저도 모든 API를 다 외우고 있지 않고 또 외울 필요도 없습니다.

외워도 자주 사용하지 않는다면 잊어버릴 수 밖에 없고 API의 다양한 옵션이 있는데 이런 옵션도 외울수가 없기 때문이죠.

그럼 강좌를 통해 얻고자 하는게 있다면 이런 데이터 시각화 방법이 있고 seaborn의 API를 사용할 때 ? 혹은 ??로 소스코드를 보는 방법, shift+tab+tab 키를 통해 문서를 보는 방법을 익히고 나중에 프로젝트를 진행하게 된다면 이런 그래프를 여기에 적용해 보면 좋겠다고 떠오르는게 있을거에요.

여러 데이터에 다양한 시각화를 하다보면 이런 데이터에는 이런 시각화가 맞겠다고 생각하고 적용할 수 있는 방법을 배운다고 생각하면 좋겠습니다.

예를 들면 수치 데이터에 어울리는 시각화, 범주형 데이터에 어울리는 시각화, 어떨 때 서브플롯을 그리면 좋을지,

머신러닝에 활용한다면 회귀 모델을 만든다 가정하고 실제값과 예측값의 차이를 표현하기 위해 scatter, reg, lm, joint, resid 등 다양한 plot을 사용할 수 있는데 어떤 plot으로 표현하는게 적절할지를 고민해 보면 좋겠습니다.

또 이상치를 탐지한다든지 범주형 값을 전처리 하고자 할때 어떤 데이터가 있는지 탐색해 본다든지 하는 감각을 키워보시면 좋겠습니다.