BEST
데이터 사이언스

/

데이터 분석

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

(4.8) 수강평 167

수강생 2,512

Thumbnail

초급자를 위해 준비한
[데이터 분석, 데이터 분석] 강의입니다.

Pandas로 데이터 분석, 전처리, 머신러닝, 딥러닝에 활용하다 보면 늘 사용하는 기능 위주로 사용하게 됩니다. 이런 핵심적인 내용만을 모아 정리해 놓은 Pandas Cheat Sheet가 있습니다. 두꺼운 책으로 Pandas를 배우다 지치신 분들께 단 두 장의 문서로 Python Pandas를 알려드립니다. Pandas 공식 튜토리얼에서 제공하는 cheat sheet로 Pandas의 핵심 기능을 익혀봅니다.

이런 걸
배워요!

  • 판다스 치트 시트에서 전하는 핵심 기능

  • 파이썬 데이터 분석

  • 머신러닝, 딥러닝을 위한 데이터 전처리

  • 데이터 시각화

  • 서울시 코로나19 사이트를 판다스로 크롤링, 전처리, 분석, 시각화 하기

파이썬 판다스 데이터 분석, 핵심만 한번에! 

단 두 장의 문서로 
판다스 데이터 분석을 
해결할 수 있다구요?

Python에서 엑셀과 유사한 기능을 사용할 수 있는 라이브러리로 Pandas(판다스)가 있습니다.

엑셀로 감당 안 되는 
대규모 데이터 처리도 OK.

판다스는 데이터 분석, 전처리를 위한
파이썬 데이터 분석 라이브러리입니다.

파이썬 판다스로 데이터 분석이나 전처리, 시각화를 하다 보면 주로 사용하는 기능들 위주로 사용하게 됩니다. 그리고 바로 이런 핵심적인 기능을 단 두 장에 정리해 둔 치트 시트(Cheet Sheets)가 있습니다. 

그런데, 이런 핵심적인 내용만 정리되어 있는 치트 시트를 혼자 보려면 어떤 내용을 어떻게 실습해야 할지 막막할 수 있습니다. 이 강의에서는 치트 시트의 핵심 내용만을 뽑아서 설명한 뒤, 복잡한 Matplotlib을 Pandas로 쉽게 사용할 수 있는 방법을 안내해드립니다. 함께 도전해보실까요?


누가 배우면 좋을까요?

데이터 분석, 
ML/DL에 필요한 
전처리를 하고자 
하시는 분 

큰 용량의 데이터를 
엑셀로 열다가 
파일이 열리지 않아 
당황하셨던 분 

엑셀을 사용해 
데이터 분석을 하다 
복잡한 수식에 
지치신 분 

엑셀에서 다양한 
수식을 구현했지만 
속도가 느려 
야근을 해야 했던 분 

📣 선수 지식을 확인해주세요!

  • 파이썬 및 주피터 노트북, 아나콘다(Anaconda), 엑셀의 행/열 개념에 대한 선수 지식이 필요합니다.

공식문서 중심으로 
쉽고 빠르고 정확하게.

하나, 주피터 노트북에서 
docstring 활용하기 

많은 메소드를 다 외울 필요 없습니다. 쓰이는 기능은 정해져 있으니까요. 이 강의에서는 도움말과 다큐멘트를 보고 스스로 학습하실 수 있도록 주피터 노트북에서 공식 문서를 찾아보며 실습하는 방법을 알려드립니다.

둘, 판다스 데이터 시각화 
2배로 잘 하는 법! 

어떤 데이터에 어떤 그래프를 사용하는 게 적절할지 잘 알고 계신가요? 이 강의에서는 막대그래프, 도수분포표, 히스토그램, 정규분포의 차이와 사용법에 대해서도 살펴봅니다. 뿐만 아니라 다양한 파이썬 시각화 방법 및 옵션 사용법에 대해서도 판다스 공식 문서를 통해 설명합니다.

보너스, Series와 DataFrame 데이터 시각화까지!

파이썬 판다스 시각화 예제

파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제
파이썬 판다스 시각화 예제

추가 업데이트! 
실무에 딱 맞는
데이터 분석 프로젝트.

서울시 코로나-19 발생현황 사이트를 데이터 크롤링부터 전처리, 분석, 시각화까지 판다스를 활용해 분석해 봅니다. 단 두 장의 문서로 익혀본 내용을 현업과 유사한 프로젝트로 분석해 볼 수 있습니다. (섹션 13)

하나, 뉴스를 통해 일상에서 자주 접하는 데이터를 직접 분석해 봅니다.

  • 확진자가 가장 많이 나온 구는 어디일까요?
  • 어느 병원에서 확진자를 가장 많이 치료했을까요? 
  • 구별로 많이 이송되는 병원이 있을까요?
  • 해외유입 확진자가 가장 많이 나온 구는 어디일까요?
  • 여러 국가를 유럽, 남미 등으로 텍스트 전처리를 하기 위해서는 어떻게 해야 될까요?
  • 해외유입 확진은 월별로 어떤 어느 정도 차이가 날까요?

둘, 판다스를 통한 데이터 전처리 방법을 이해하고 실습해 봅니다.

  • 텍스트로 된 날짜에서 연, 월, 일, 요일, 주는 어떻게 구할까요?
  • 확진자 현황 데이터로 누적 확진수는 어떻게 구할까요?
  • groupby, crosstab, pivot, pivot_table의 차이는 어떻고, 어떤 기능을 사용하는 게 적합할까요?

셋, 데이터프레임과 시리즈의 데이터 구조를 이해하고 분석에 적합한 형태로 가공해 봅니다.

  • Pandas의 plot으로 그래프를 그리기 위한 데이터프레임의 형태는 어떻게 만들어야 할까요?
  • 그래프에서 범주형 값에 따라 다른 색상으로 값을 표현하고 싶다면 데이터프레임을 어떻게 변경해야 할까요?
  • 시리즈를 데이터프레임으로 바꾸는 방법은 어떤 방법이 있을까요?

파이썬 시각화 & 분석 예제,
강의에서 직접 확인해보세요!


이 강의를 만든
지식공유자가 궁금하다면? 👩‍💻

지식공유자 박조은 X 인프런 인터뷰

이런 분들께
추천드려요!

학습 대상은
누구일까요?

  • 파이썬으로 데이터 분석, 머신러닝, 딥러닝에 필요한 전처리를 하고자 하시는 분

  • 큰 용량의 데이터를 엑셀로 열다가 파일이 로드되지 않아 당황하셨던 분

  • 엑셀의 복잡한 수식에 지치신 분

  • 엑셀에서 다양한 수식을 구현했지만 속도가 느려 야근을 해야 했던 분

선수 지식,
필요할까요?

  • 파이썬

  • 주피터 노트북

  • 아나콘다

  • 엑셀의 행과 열 개념

  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

커리큘럼

전체

63 ∙ 11시간 10분

수업 자료

가 제공되는 강의입니다.

  • 판다스 강좌 소개

    02:14

강의 게시일: 2019년 05월 27일
마지막 업데이트일: 2020년 07월 10일

수강평

아직 충분한 평가를 받지 못한 강의입니다.
모두에게 도움이 되는 수강평의 주인공이 되어주세요!