이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요?
2013년부터 2018년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될까요?
우리 동네에는 어떤 공원이 있을까요? 공공데이터 포털에 있는 데이터를 어떻게 활용하면 좋을까요? 공공데이터를 통해 여러 형태의 데이터를 다뤄보며 Python과 여러 데이터분석 라이브러리에 익숙해 지는 것을 목표로 합니다.

공공데이터로 파이썬 데이터 분석 시작하기

이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 관련 기사를 읽고 구별로 이디야와 스타벅스의 매장을 기사와 유사하게 분석하고 시각화 해보면서 Python, Pandas, ggplot(plotnine), Numpy, Folium에 익숙해져 봅니다.

2013년부터 2018년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될까요? 공공데이터 포털에 있는 데이터를 Pandas 의 melt, concat, pivot, transpose 과 같은 reshape 기능을 활용해 분석해 봅니다. 그리고 groupby, pivot_table, info, describe, value_counts 등을 통한 데이터 요약과 분석을 해봅니다.

전국에는 많은 도시공원이 있습니다. 우리 동네에는 어떤 공원이 있을까요? 지역별로 어떤 공원이 어디에 분포되어 있는지 Folium을 통해 시각화 해봅니다.

공공데이터 포털에 있는 데이터를 어떻게 활용하면 좋을까요? 또 공공데이터 포털에는 어떤 데이터가 있을까요? 공공데이터를 통해 여러 형태의 데이터를 다뤄보며 Python과 여러 데이터분석 라이브러리에 익숙해 지는 것을 목표로 합니다.

학습 목표

  • 공공데이터포털에 있는 데이터를 통해 파이썬 데이터 분석에 입문해 봅니다.
  • 파이썬으로 데이터 분석을 하기 위해 어떤 도구가 필요하고 어떻게 사용해야 하는지에 대해 알아봅니다.
  • 원하는 데이터를 얻거나 가공하기 위해서 필요한 여러 전처리 기법을 알아보고 직접 실습해 봅니다.
  • 파이썬 표준라이브러리와 Numpy, Pandas를 주로 사용할 예정입니다.
  • 이렇게 얻은 데이터를 통해 파이썬으로 ggplot문법을 사용할 수 있는 plotnine이라는 시각화 도구를 통해 시각화 해봅니다.

배우는 것들

  • Pandas
    – 데이터 로드하기, 인코딩 지정하기
    – melt, concat, pivot, transpose 과 같은 reshape 기능
    – groupby, pivot_table, info, describe, value_counts 등을 통한 데이터 요약과 분석
  • Numpy
    – 데이터 타입에 대한 이해
    – 기본적인 수치계산 활용
  • ggplot(Plotnine)
    – Python으로 Data Visualization 하기
    – grammar of graphics 문법에 대한 기본적인 이해
    – barplot, pointplot, boxplot 등 기본적인 시각화 방법에 대한 이해
  • Folium
    – OpenStreetMap을 통해 지도 데이터 활용하기
    – 위경도 정보로 Marker, CircleMarker, GeoJSON을 활용하여 choropleth 그리기

 도움이 되는 분들

  • 업무에 데이터 분석을 활용하고자 하는 분
  • 데이터를 통해 의미를 찾고자 하는 분
  • 데이터 저널리즘에 관심 있는 분
  • 공공데이터를 활용하고자 하는 분
  • Pandas, NumPy 등의 파이썬 라이브러리의 기본을 익히고 싶은 분
  • Folium, GeoJSON을 활용해 위도, 경도, 주소정보 등의 지리 정보를 데이터 분석에 활용하고자 하는 분
  • 파이썬으로 데이터 시각화를 익히고자 하는 분
  • 데이터 분석가

참고 사항

지식공유자 소개

박조은

주로 게임과 광고회사에서 10년 이상 웹과 서버개발자로 일해 왔습니다.
다양한 데이터를 다루고 분석하는 것을 좋아합니다.

강좌 평가

5

2 개의 수강평
  • 5 점2
  • 4 점0
  • 3 점0
  • 2 점0
  • 1 점0
  1. JeongJin Kim의 프로필 사진

    완전 초보인데 도움 참 많이 되었습니다!

    5

    코딩과는 아무런 관계없는 제가 어느날 갑자기 취미로 해야겠다고 이리저리 강좌 알아보다가 찾게되었는데
    딱 공부하고 싶던 분야의 강의를 올려주셔서 감사히 보고있습니다. (데이터분석)
    여기서 보다가 유투브도 찾아서 들어갔는데 정말 유익한 강좌를 많이 있어요!
    어느날 갑자기 유료로 전환될수도 있으니 얼른얼른 서둘러 들어야겠습니다.
    덜컥 맥북 사놓고 어떻게 써야하나~ 고민 많았는데
    강좌 들으면서 정말 공부 많이 하고 있고 하나도 지루하지가 않습니다.

강좌 교육과정

Chapter1. 전국 신규 민간 아파트 분양가 분석
[소개] 전국 신규 민간 아파트 분양가 분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:00:00
신규 민간 아파트 분양가격 데이터셋 소개학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:13:00
Pandas로 데이터 불러오고 요약하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:18:00
Pandas의 groupby, pivot_table 사용하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:11:00
파이썬에서 ggplot 문법을 사용해 시각화하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:15:00
2015년 이전 아파트 분양가 데이터 전처리하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:13:00
Pandas의 concat으로 데이터 합치고 boxplot 그리기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:11:00
Chapter2. 상가(상권)정보로 위경도 정보 활용하기
[소개] 상가 업소 정보 2018로 위경도 정보 활용하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:00:00
판다스로 데이터 로드하기 미리보기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:10:00
판다스로 결측치 분석하기, ggplot 문법으로 시각화하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:11:00
대분류, 중분류별 요약하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:08:00
Chapter3. 프랜차이즈 입점 분석
[소개] 프랜차이즈 입점 분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:00:00
read_csv로 파일 불러오기, shape로 요약보기, str.contains 로 특정 상호가져오기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:10:00
Pandas로 요약하고 glplot 문법으로 시각화하여 업종 분석하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:06:00
배스킨라빈스와 던킨도너츠 위치분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:12:00
뚜레쥬르, 파리바게뜨 매장 위치 분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:09:00
Chapter4. 스타벅스, 이디야 매장위치 비교
[소개] 구별 스타벅스, 이디야 입점 분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:00:00
Python, Pandas, folium으로 스타벅스, 이디야 매장 위치 분석하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:17:00
Pandas의 groupby를 활용해 구별 스타벅스, 이디야 매장수 비교학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:10:00
choropleth로 행정구역별 스타벅스, 이디야 매장 합계를 표현하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:17:00
서울 구별 스타벅스 매장 분포와 밀집도 표현하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:11:00
서울 구별 이디야 매장 분포와 밀집도 표현하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:08:00
Pandas의 reshaping data 활용하여 스타벅스, 이디야 매장수 비교하기, 구별 위도/경도 평균 구하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:11:00
Pandas의 pivot_table로 구한 데이터를 Folium의 CircleMaker로 매장수 크기를 반영해 그리기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:16:00
Chapter5. 전국 도시공원 표준데이터 분석
[소개] 전국 도시공원 표준데이터 분석학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:00:00
전국 도시 공원 표준 데이터 불러오기, 요약하기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:11:00
주소 및 사용하지 않는 컬럼 결측치 처리학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:11:00
ggplot(plotnine)시각화 지역별, 공원구분별 시각화학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:08:00
경기도 도시공원 Folium 으로 보기학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:09:00
서울, 제주 도시공원 결측치, 이상치, 오류값 분석, Folium 으로 시각화학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 00:15:00
부록
파이썬 데이터 시각화 툴인 Matplotlib에서 한글폰트 사용하는 방법학습을 원하시면 최상단 '배우기 버튼을 클릭해주세요' 미리보기 00:08:00
  • 무료
  • 평생
  • ,
  • 31개 강의, 총 4 시간 59 분
  • 위시리스트

실시간 인기 강좌

우리는 성장기회의 평등을 추구합니다. 🎄

경제적, 시간적 제약없는 양질을 교육으로 누구나에게 성장 기회를 균등하게 주는 것. 그것이 우리의 목표입니다.

지식공유참여 고객센터
top
(주)인프랩 | 대표자:이형주 | TEL:070-4178-0406 | E-MAIL: course@inflearn.com | 사업자번호:499-81-00612
주소:성남시 분당구 삼평동 대왕판교로 645번길 12 경기창조경제혁신센터 8층 R19 | 개인정보보호책임자:이형주
통신판매업:2017-서울강남-01544 | ©INFLAB. ALL RIGHTS RESERVED