단 두 장의 문서로 데이터 분석과 시각화 뽀개기
단 두 장의 문서로 데이터 분석과 시각화 뽀개기
수강정보
(79개의 수강평)
1548명의 수강생

이 강의는

Pandas 로 데이터 분석, 전처리, 머신러닝, 딥러닝에 활용하다보면 늘 사용하는 기능 위주로 사용하게 됩니다. 이런 핵심적인 내용만을 모아 정리해 놓은 Pandas Cheat Sheet 이 있습니다. 두꺼운 책으로 Pandas를 배우다 지치신 분들께 단 두 장의 문서로 Python Pandas 를 알려드립니다. Pandas 공식 튜토리얼에서 제공하는 cheat sheet 으로 Pandas 의 핵심기능을 익혀봅니다.

판다스 데이터 분석, 핵심만 골라서 한번에!
간편하게 데이터를 분석하고, 시각화해 보세요.

📣 강의 수업 추가 업데이트 안내!
• 일 년 동안 많은 분들이 강의를 수강해 주신 데 대한 감사의 뜻으로, 2020년 7월 10일 판다스를 통한 분석 수업 콘텐츠를 추가했습니다. (섹션 13) 이번에 추가된 수업은 서울시에서 6월까지 공개하고 있는 코로나19 확진자 현황 데이터를 판다스만으로 크롤링해 분석하는 내용을 담고 있습니다. 앞으로도 꾸준히 강의를 개선하고 업데이트할 예정입니다. 강의에서 직접 확인해 보세요! (‘강의 새소식’ 전문 바로가기)

Python에서 엑셀과 유사한 기능을 사용할 수 있는 라이브러리로 Pandas가 있습니다. 데이터 분석이나 전처리를 하다보면 주로 사용하는 기능들 위주로 사용하게 됩니다. 이런 핵심적인 내용만 정리되어 있는 cheat sheet 을 혼자 보려면 어떤 내용을 어떻게 실습해야할지 막막할 수 있습니다. 핵심 내용만을 뽑아서 설명하고 복잡한 matplotlib을 pandas 로 쉽게 사용할 수 있는 방법을 안내합니다. 

 

# 주피터 노트북에서 docstring 활용하기

  • 많은 메소드를 다 외우시지 않고 도움말과 다큐멘트를 보고 학습하실 수 있도록 주피터 노트북에서 공식문서를 찾아보며 실습하는 방법을 주로 다루고 있습니다. 

# 데이터 시각화

  • 어떤 데이터에 어떤 그래프를 사용하는게 적절할지, 막대그래프, 도수분포표, 히스토그램, 정규분포의 차이와 사용법에 대해서도 다루고 있습니다.
    또, 다양한 시각화 방법과 옵션의 사용법에 대해 판다스 공식문서를 통해 설명합니다.

Series 와 DataFrame 데이터 시각화

2020년 7월 신규 업데이트!
단 두 장의 문서로 익혀본 내용을
현업과 유사한 프로젝트로 분석해 보기

서울시 코로나 19 발생현황 사이트를 크롤링부터 전처리, 분석, 시각화까지 판다스를 활용해서 분석해 봅니다.

# 뉴스기사와 일상을 통해 자주 접하는 데이터를 직접 분석해 봅니다.

  • 확진자가 가장 많이 나온 구는 어디일까요?
  • 어느 병원에서 확진자를 가장 많이 치료했을까요? 
  • 구별로 많이 이송되는 병원이 있을까요?
  • 해외유입 확진자가 가장 많이 나온 구는 어디일까요?
  • 여러 국가를 유럽, 남미 등으로 텍스트 전처리를 하기 위해서는 어떻게 해야 될까요?
  • 해외유입 확진은 월별로 어떤 어느정도 차이가 날까요?

# 판다스를 통한 데이터 전처리 방법을 이해하고 실습해 봅니다.

  • 텍스트로 된 날짜에서 연, 월, 일, 요일, 주는 어떻게 구할까요?
  • 확진자 현황 데이터로 누적 확진수는 어떻게 구할까요?
  • groupby, crosstab, pivot, pivot_table의 차이는 어떻게 되고 어떤 기능을 사용하는게 적합할까요?

# 데이터프레임과 시리즈의 데이터 구조를 이해하고 분석에 적합한 형태로 가공해 봅니다.

  • Pandas의 plot으로 그래프를 그리기 위한 데이터프레임의 형태는 어떻게 만들어야 할까요?
  • 그래프에서 범주형 값에 따라 다른 색상으로 값을 표현하고 싶다면 데이터프레임을 어떻게 변경해야 할까요?
  • 시리즈를 데이터프레임으로 바꾸는 방법은 어떤 방법이 있을까요?

강좌에서 직접 확인해 보세요!

이런 걸 배워요

  • 단 두 장의 문서로 파이썬 판다스로 데이터 분석과 시각화 뽀개기
  • 파이썬 데이터 분석
  • 머신러닝, 딥러닝을 위한 데이터 전처리
  • 데이터 시각화
  • 서울시 코로나19 사이트를 판다스로 크롤링, 전처리, 분석, 시각화 하기

도움 되는 분들

  • 파이썬으로 데이터분석, 머신러닝, 딥러닝에 필요한 전처리를 하고자 하시는 분
  • 큰 용량의 데이터를 엑셀로 열다가 파일이 로드되지 않아 당황하셨던 분
  • 엑셀의 복잡한 수식에 지치신 분
  • 엑셀에서 다양한 수식을 구현했지만 속도가 느려 야근을 해야 했던 분

선수 지식

  • 파이썬
  • Python
  • 주피터 노트북
  • 아나콘다
  • Jupyter Notebook
  • 엑셀의 행과 열 개념

공개 일자

2019년 5월 27일 (마지막 업데이트 일자 : 2020년 7월 10일)
4.8
79개의 수강평
default_profile.png
티보그 2달 전
강사님의 분석 방법을 내것으로 만들고 싶어요. 감사합니다.
세바스찬 주니어 3세

세바스찬 주니어 3세 1달 전
욕심쟁이 입니까?

default_profile.png
sjpark00 4달 전
문서는 출력해서 익숙해 질 때까지 책상에 붙여 두려고요 ㅎㅎ
default_profile.png
세바스찬 주니어 3세 1달 전
초급자로서 판다스에 대한 개념을 전반적으로 익히고, 실제 분석에 어떻게 활용할 수 있을지 꼼꼼하게 배울 수 있는 명강의라고 생각합니다. 판다스 관련 강의들을 몇 가지 들어봤는데 세심한 부분들까지 하나하나 퀄리티있게 알려주는 강의는 이 강의 밖에는 없는 것 같아요. 다시 한 번 더 복습을 한 뒤에 실제 업무용 데이터로도 적용해서 분석해보려고 합니다. 좋은 강의 만들어주셔서 진심으로 감사드립니다!!

교육과정

모두 펼치기 56 강의 9시간 57분
섹션 0. 판다스 강좌 소개
1 강의 02 : 14
판다스 강좌 소개
02 : 14
섹션 2. Subset Observations (Rows)
3 강의 25 : 56
3) 판다스 데이터프레임 비교연산자로 색인하기, drop_duplicates()
06 : 35
4) Logic in Python (and pandas) - and, or, not, xor, any, all 연산 이해하기
09 : 45
5) head, tail로 데이터 미리보기 df.sample(frac=0.5), df.sample(n=10), df.nlargest, df.nsmallest
09 : 36
섹션 5. Handling Missing Data
1 강의 08 : 17
9) fillna, dropna로 결측치 다루기
08 : 17
섹션 7. Reshaping Data
3 강의 30 : 10
섹션 8. Combine Data Sets
1 강의 13 : 59
14) merge로 데이터프레임 합치기 left, right, inner, outer 옵션 사용하기
13 : 59
섹션 9. Group Data
1 강의 12 : 25
15) groupby 활용하여 다양한 데이터 집계를 활용하기
12 : 25
섹션 11. 데이터 시각화 Plotting 기능 활용하기
11 강의 81 : 13
17) 파이썬 판다스로 Series 와 DataFrame 데이터 시각화 하기 소개
11 : 41
18) 파이썬 데이터 시각화 판다스로 bar plot 막대그래프 그리기
08 : 17
19) 파이썬 데이터 시각화 히스토그램과 도수분포표 이해하기, 막대그래프 vs 히스토그램 차이점 이해하기
09 : 05
20) 파이썬 판다스로 차분 diff 값을 구하고 히스토그램으로 표현하기
06 : 32
21) 파이썬 시각화 상자 수염 그림(box plot) 그리기
10 : 26
22) 파이썬 데이터 시각화 Area plot, Grid 옵션으로 그래프 격자 만들기
03 : 19
23) 파이썬 데이터 시각화 scatter plot, 산점도 그리기
04 : 46
24) 파이썬 데이터 시각화 히스토그램과 산점도를 보완한 Hexbin plot 그리기
06 : 22
25) Pandas pie plot, 원 그래프, 왜 seaborn 에는 파이차트가 없을까?
07 : 10
26) Scatter Matrix Plot 산점도와 커널밀도함수를 함께 표현해 보도록 합니다.
02 : 47
27) 파이썬 시각화 분포도 그리기, Kernel Density Estimate plot 커널밀도함수, 밀도함수
10 : 48
섹션 12. 실습안내와 함께보면 좋을 자료들
2 강의 08 : 17
28) 소스코드 위치 안내와 다운로드 방법, 추가로 참고하면 좋을 자료들
04 : 27
29) colab(google colaboratory) 에서 github 에 있는 파이썬 판다스 실습코드를 실행해 보는 방법
03 : 50
섹션 13. 판다스로 서울 코로나19 발생동향 분석하기
26 강의 349 : 57
[0/25] 소스코드와 파일 다운로드 위치
[1/25] 판다스 단 한 줄로 서울시 코로나19 발생동향 수집하기
17 : 14
[2/25] 판다스로 분석해볼 내용 소개
13 : 09
[3/25] 판다스로 수집해 온 CSV 파일 로드하기
08 : 13
[4/25] 시각화를 위한 한글 폰트 설정
05 : 00
[5/25] 시계열 데이터 전처리
09 : 33
[6/25] 확진일자별 빈도 선그래프 그리기 - Pandas plot에 스타일 적용하기
06 : 42
[7/25] 엑셀에서는 쉽게 되는 그래프에 값 표시하기 pandas plot 에서는 어떻게 해야될까?
11 : 58
[8/25] 일부 데이터만 잘라서 시각화 하고 싶을때 슬라이싱 기능 사용하기
13 : 42
[9/25] 월단위로 확진자 추이는 어떻게 될까?
05 : 57
[10/25] 여러 변수의 빈도수를 구하려면?
10 : 30
[11/25] 확진자가 없는 날은 데이터프레임에 어떻게 만들까?
16 : 17
[12/25] 그래프에서 누적확진자수가 너무 커서 일별 확진자 수를 알아보기 어렵다면?
16 : 21
[13/25] 월별, 요일별 확진자수는 어떻게 달라졌을까?
15 : 44
[14/25] 거주지(구)별 확진자는 어떻게 될까?
27 : 27
[15/25] 빈도수가 가장 많은 감염경로는?
19 : 16
[16/25] 감염경로를 모르는 확진수는 월과 주별로 어느정도 차이가 있을까?
13 : 26
[17/25] 텍스트 안에 있는 접촉번호는 어떻게 추출해야 될까?
10 : 28
[18/25] 조치사항에서 퇴원여부의 빈도수 구하기
13 : 05
[19/25] 어느 병원에서 확진자를 가장 많이 치료했을까요?
18 : 17
[20/25] 해외유입은 어느 지역이 많을까요? 구별로 해외 유입 국가에 대한 차이가 있을까요?
23 : 50
[21/25] 일자별 해외유입 누적확진자수 구하기
12 : 54
[22/25] 전체 확진자중 해외 유입 비율은 구마다 얼마나 차이가 있을까요?
19 : 27
[23/25] 월별 해외 확진자 수 추이는?
07 : 26
[24/25] groupby vs crosstab vs pivot vs pivot_table 의 차이는?
21 : 33
[25/25] 국가별, 구별 해외 유입은 얼마나 차이가 있을까요?
12 : 28

수강 문의

  • 이미란 프로필 이미란
    2020-10-19 79434

    강의 수강하려고 하는데요, 파이썬 기본 문법에 대해 어느 정도 알고 있어야 수강하는 데 무리가 없을 지 질문 드립니다~

    박조은
    박조은
    박조은
    2020-10-19 75321

    안녕하세요. 파이썬 기본 문법의 문자열, 변수, 인덱싱, 슬라이싱, 반복문 등의 개념을 알고 있으면 무리가 없을 듯 합니다. 강의에서는 판다스 문법을 주로 사용하기 때문에 위에 제시한 개념 정도를 이해하고 계시면 들으실 수 있을거 같습니다. 감사합니다 :)

다른 수강문의 보기
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스