📱인프런 모바일 App 😆
파이썬 판다스 데이터 분석과 시각화 뽀개기(Python Pandas)

파이썬 판다스 데이터 분석과 시각화 뽀개기(Python Pandas)

(12개의 수강평)

775명의 수강생

33,000원

평생
입문, 초급
30개 수업, 총 4시간 7분
위시리스트 추가


Python에서 엑셀과 유사한 기능을 사용할 수 있는 라이브러리로 Pandas가 있습니다. 데이터 분석이나 전처리를 하다보면 주로 사용하는 기능들 위주로 사용하게 됩니다. 이런 핵심적인 내용만 정리되어 있는 cheat sheet 을 혼자 보려면 어떤 내용을 어떻게 실습해야할지 막막할 수 있습니다.  핵심 내용만을 뽑아서 설명하고 복잡한 matplotlib을 pandas 로 쉽게 사용할 수 있는 방법을 안내합니다. 

 

# 주피터 노트북에서 docstring 활용하기
많은 메소드를 다 외우시지 않고 도움말과 다큐멘트를 보고 학습하실 수 있도록 주피터 노트북에서 공식문서를 찾아보며 실습하는 방법을 주로 다루고 있습니다. 
 
# 데이터 시각화
어떤 데이터에 어떤 그래프를 사용하는게 적절할지, 막대그래프, 도수분포표, 히스토그램, 정규분포의 차이와 사용법에 대해서도 다루고 있습니다.
또, 다양한 시각화 방법과 옵션의 사용법에 대해 판다스 공식문서를 통해 설명합니다.

Series 와 DataFrame 데이터 시각화

배우면 할 수 있는 것들

  • 단 두 장의 문서로 파이썬 판다스로 데이터 분석과 시각화 뽀개기
  • 파이썬 데이터 분석
  • 머신러닝, 딥러닝을 위한 데이터 전처리
  • 데이터 시각화

수강 대상

  • 파이썬으로 데이터분석, 머신러닝, 딥러닝에 필요한 전처리를 하고자 하시는 분
  • 큰 용량의 데이터를 엑셀로 열다가 파일이 로드되지 않아 당황하셨던 분
  • 엑셀의 복잡한 수식에 지치신 분
  • 엑셀에서 다양한 수식을 구현했지만 속도가 느려 야근을 해야 했던 분

선수 지식

  • 파이썬
  • Python
  • 주피터 노트북
  • 아나콘다
  • Jupyter Notebook
  • 엑셀의 행과 열 개념

지식공유자 소개

박조은

교육과정

판다스 강좌 소개
판다스 강좌 소개
02 : 14
DataFrame & Series
1) 판다스 데이터프레임(DataFrame)과 시리즈(Series) 이해하기
07 : 05
2) 판다스 데이터프레임 생성하고 데이터 가져오기
06 : 40
Subset Observations (Rows)
3) 판다스 데이터프레임 비교연산자로 색인하기, drop_duplicates()
06 : 35
4) Logic in Python (and pandas) - and, or, not, xor, any, all 연산 이해하기
09 : 45
5) head, tail로 데이터 미리보기 df.sample(frac=0.5), df.sample(n=10), df.nlargest, df.nsmallest
09 : 36
Subset Variables (Columns)
6) 일부 컬럼을 기준으로 데이터 가져오기 Subset Variables (Columns)
12 : 31
Summarize Data
7) 기본 통계 하기 value_counts, nunique, sum, count, mean, median
11 : 46
8) 판다스로 apply 활용하기 lambda 익명함수 사용하기
03 : 47
Handling Missing Data
9) fillna, dropna로 결측치 다루기
08 : 17
Make New Columns
10) assign 으로 새로운 컬럼 만들기, qcut으로 binning, bucketing 하기
10 : 45
Reshaping Data
11) df.sort_values, rename, sort_index, reset_index로 데이터 프레임 Reshaping 하기
09 : 32
12) melt, pivot 으로 Tidy Data 만들기
10 : 15
13) pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기
10 : 23
Combine Data Sets
14) merge로 데이터프레임 합치기 left, right, inner, outer 옵션 사용하기
13 : 59
Group Data
15) groupby 활용하여 다양한 데이터 집계를 활용하기
12 : 25
시계열 데이터 분석 Windows
16) 시계열 데이터(Time Series Data) 분석을 위한 판다스 Expanding and Rolling 이해하기
12 : 23
데이터 시각화 Plotting 기능 활용하기
17) 파이썬 판다스로 Series 와 DataFrame 데이터 시각화 하기 소개
11 : 41
18) 파이썬 데이터 시각화 판다스로 bar plot 막대그래프 그리기
08 : 17
19) 파이썬 데이터 시각화 히스토그램과 도수분포표 이해하기, 막대그래프 vs 히스토그램 차이점 이해하기
09 : 05
20) 파이썬 판다스로 차분 diff 값을 구하고 히스토그램으로 표현하기
06 : 32
21) 파이썬 시각화 상자 수염 그림(box plot) 그리기
10 : 26
22) 파이썬 데이터 시각화 Area plot, Grid 옵션으로 그래프 격자 만들기
03 : 19
23) 파이썬 데이터 시각화 scatter plot, 산점도 그리기
04 : 46
24) 파이썬 데이터 시각화 히스토그램과 산점도를 보완한 Hexbin plot 그리기
06 : 22
25) Pandas pie plot, 원 그래프, 왜 seaborn 에는 파이차트가 없을까?
07 : 10
26) Scatter Matrix Plot 산점도와 커널밀도함수를 함께 표현해 보도록 합니다.
02 : 47
27) 파이썬 시각화 분포도 그리기, Kernel Density Estimate plot 커널밀도함수, 밀도함수
10 : 48
실습안내와 함께보면 좋을 자료들
28) 소스코드 위치 안내와 다운로드 방법, 추가로 참고하면 좋을 자료들
04 : 27
29) colab(google colaboratory) 에서 github 에 있는 파이썬 판다스 실습코드를 실행해 보는 방법
03 : 50

수강 후기

4.7
12개의 수강평
nyj6263 1달 전
cheat sheet을 혼자 봤을 때는 막연했는데 강의를 보고 나니깐 어떻게 활용해야 될지 알 것 같습니다. 그리고 판다스도 전체적으로 알아볼 수 있어서 좋았습니다.
박조은 프로필

박조은 1달 전
감사합니다 :)

hs moon 17시간 전
다음 강의도 기대됩니다!
박조은 프로필

박조은 5시간 전
감사합니다 :)