BEST
데이터 사이언스

/

데이터 분석

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

Pandas로 데이터 분석, 전처리, 머신러닝, 딥러닝에 활용하다 보면 늘 사용하는 기능 위주로 사용하게 됩니다. 이런 핵심적인 내용만을 모아 정리해 놓은 Pandas Cheat Sheet가 있습니다. 두꺼운 책으로 Pandas를 배우다 지치신 분들께 단 두 장의 문서로 Python Pandas를 알려드립니다. Pandas 공식 튜토리얼에서 제공하는 cheat sheet로 Pandas의 핵심 기능을 익혀봅니다.

(4.8) 수강평 168개

수강생 2,525명

Thumbnail

"단 두장의 문서로 데이터 분석과 시각화 뽀개기"에 서울시 코로나19 크롤링부터 분석, 시각화 수업 콘텐츠가 추가되었습니다.

안녕하세요.

"단 두 장의 문서로 데이터 분석과 시각화 뽀개기" 강좌를 수강해 주셔서 감사합니다!

온라인과 오프라인 수강생 분들께 Pandas Cheat Sheet 을 소개하며 정말 두 장의 문서만으로도 판다스의 주요 기능을 익혀볼 수 있는 것을 알려드리고 싶어서 강좌를 만들게 된게 일년이 넘었습니다.

일년동안 많은 분들이 이 강좌를 수강해 주셨습니다.

감사의 뜻으로 판다스를 통한 분석 콘텐츠를 추가했습니다.

"공공데이터로 파이썬 데이터분석 시작하기"를 통해 프로젝트 형식으로 데이터를 분석해 보실 수도 있는데요.

이 강좌에도 비슷한 프로젝트를 해보는 수업이 있으면 좋겠다는 생각이 들어서 현업과 유사한 프로젝트 수업 콘텐츠를 추가하게 되었습니다.

각 지자체에서 코로나 관련 데이터를 공개하고 있는데요.

서울시에서 공개하고 있는 코로나19 발생현황 사이트를 판다스 만으로 크롤링해서 분석하는 콘텐츠를 추가했습니다.

해당 강좌에서는 6월까지의 서울시에서 공개하고 있는 확진자 현황 데이터를 분석합니다.

단 두장의 문서로 익혀본 내용을 현업과 유사한 프로젝트로 분석해 보기

서울시 코로나 19 발생현황 사이트를 크롤링부터 전처리, 분석, 시각화까지 판다스를 활용해서 분석해 봅니다.

뉴스기사와 일상을 통해 자주 접하는 데이터를 직접 분석해 봅니다.

  • 확진자가 가장 많이 나온 구는 어디일까요?
  • 어느 병원에서 확진자를 가장 많이 치료했을까요? 
  • 구별로 많이 이송되는 병원이 있을까요?
  • 해외유입 확진자가 가장 많이 나온 구는 어디일까요?
  • 여러 국가를 유럽, 남미 등으로 텍스트 전처리를 하기 위해서는 어떻게 해야 될까요?
  • 해외유입 확진은 월별로 어느정도 차이가 날까요?

판다스를 통한 데이터 전처리 방법을 이해하고 실습해 봅니다.

  • 텍스트로된 날짜에서 연, 월, 일, 요일, 주는 어떻게 구할까요?
  • 확진자 현황 데이터로 누적 확진수는 어떻게 구할까요?
  • groupby, crosstab, pivot, pivot_table의 차이는 어떻게 되고 어떤 기능을 사용하는게 적합할까요?

 

데이터프레임과 시리즈의 데이터 구조를 이해하고 분석에 적합한 형태로 가공해 봅니다.

  • Pandas 의 plot으로 그래프를 그리기 위한 데이터프레임의 형태는 어떻게 만들어야 할까요?
  • 그래프에서 범주형 값에 따라 다른 색상으로 값을 표현하고 싶다면 데이터프레임을 어떻게 변경해야 할까요?
  • 시리즈를 데이터프레임으로 바꾸는 방법은 어떤 방법이 있을까요?

강좌에서 직접 확인해 보세요!

 

 

지난 일년동안 많은 질문과 좋은 수강평을 남겨주신 덕분에 강의를 업데이트 할 수 있었습니다.

앞으로도 꾸준히 강좌를 개선하고 업데이트 할 예정입니다.

좋은 수강평을 남겨주시면 꾸준한 콘텐츠 개선에 큰 힘이 됩니다

 

코로나19에서 벗어나 다시 일상으로 돌아갈 수 있기를 기원합니다!

감사합니다.

댓글