Thumbnail

공공데이터로 파이썬 Python 데이터 분석 스터디 대시보드

(5)
2개의 수강평 ∙  5명의 수강생
공개되지 않은 강의로
수강이 제한됩니다.
지식공유자: 박조은
총 41개 수업 (5시간 33분)
수강기한: 
무제한
수료증: 발급
난이도: 
입문
-
초급
-
중급이상
지식공유자 답변: 미제공

공공데이터를 통해 여러 형태의 데이터를 다뤄보며 Python과 여러 데이터분석 라이브러리에 익숙해 지는 것을 목표로 합니다.

✍️
이런 걸
배워요!
파이썬으로 ggplot문법을 사용할 수 있는 plotnine이라는 시각화 도구를 통해 시각화 해봅니다.
파이썬 표준라이브러리와 Numpy, Pandas를 주로 사용해 봅니다
원하는 데이터를 얻거나 가공하기 위해서 필요한 여러 전처리 기법을 알아보고 직접 실습해 봅니다.
파이썬으로 데이터 분석을 하기 위해 필요한 도구를 알고 이용할 수 있게 됩니다.

인기 강좌를 온라인 스터디로 공부해보세요!

강의를 수강하면서 궁금했던 부분들과 과제 풀이로 확실하게 마스터해갈 수 있습니다.
온라인 스터디를 완주하기만 해도 강의료를 환급받을 수 있어요! :)

온라인 스터디를 하면 좋은점 


동기부여가 된다.

완주 시 지급되는 환급 리워드와 강사님의 피드백으로 혼자 공부하는 것보다 의욕이 나요!

효율적인 공부를 할 수 있다.

온라인으로 진행되는 스터디라서 어디서든 내가 원하는 곳에서 공부할 수 있어요.

이제는 혼자가 아니다.

내가 제대로 하고 있는 것인지 확실하지 않고 답답할 때,
같이 공부하는 사람들과 소통하고 궁금한 걸 강사님에게 의논해보세요.

🌱 혼자 가면 빨리갈 수 있지만, 같이 가면 멀리갈 수 있습니다.

스터디 상세 요건

1. 강좌를 완주하면 5만원의 환급 혜택을 제공해 드립니다.
- 강의영상 100% 진도
- 4개의 과제 중 3개를 기한내에 제출해주세요. (4주차는 필수에요!)

2. 스터디 기간 : 2019년 6월 24일 ~ 7월 21일
스터디는 이런 식으로 진행돼요 :)
- (1주차) 6월 24일 ~ 6월 30일 : 개강 인사, 1주차 영상 및 과제 진행
- (2주차) 7월 1일 ~ 7월 7일 : 과제 코드리뷰 및 2주차 영상 및 과제 진행
- (3주차) 7월 8일 ~ 7월 14일 : 과제 코드리뷰 및 3주차 영상 및 과제 진행
- (4주차) 7월 15일 ~ 7월 21일 : 과제 코드리뷰 및 4주차 영상 및 과제 진행
* 제공될 영상의 내용은 "교육과정"에서 확인해주세요.

3. 스터디 진행 방법

  • 매주 진도 공지
  • Slack으로 궁금한 점 질문
  • 주간 과제 제출
  • 스터디 종료 후에도 영상 시청 가능

강의 상세내용

공공데이터로 파이썬 데이터 분석 시작하기

이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 관련 기사를 읽고 구별로 이디야와 스타벅스의 매장을 기사와 유사하게 분석하고 시각화 해보세요!
-

Python, Pandas, ggplot(plotnine), Numpy, Folium을 사용해봅니다.
공공데이터 포털에 있는 데이터를 Pandas 의 melt, concat, pivot, transpose 과 같은 reshape 기능을 활용해 분석해 봅니다.
그리고 groupby, pivot_table, info, describe, value_counts 등을 통한 데이터 요약과 분석을 해봅니다.

 
전국에는 많은 도시공원이 있습니다. 우리 동네에는 어떤 공원이 있을까요?
공공데이터 포털에 있는 데이터를 어떻게 활용하면 좋을까요? 또 공공데이터 포털에는 어떤 데이터가 있을까요?
-

지역별로 어떤 공원이 어디에 분포되어 있는지 Folium을 통해 시각화 해봅니다.

 
공공데이터를 통해 여러 형태의 데이터를 다뤄보며 Python과 여러 데이터분석 라이브러리에 익숙해 지는 것을 목표로 합니다.

# 이런 분들에게 추천드려요.

  • 데이터 분석에 관심이 있지만 아직 시작은 못하겠는 분
  • 파이썬 언어는 배웠는데 활용법은 모르는 분
  • 아무것도 모르겠지만 일단 뭔가 해내고 싶은 분

# 이런 것들을 할 수 있어요.


파이썬을 몰라도 할 수 있는 판다스로 데이터를 로드합니다.

Numpy로 수치계산을 "간단"하게 활용해볼 수 있어요.

완전 멋진 시각화 차트를 만들어보세요.

비싼 컴퓨터, 누가봐도 느낌있게 활용할 수 있어요.

#연관된 강좌

강좌만 듣고 싶다면 아래를 클릭해주세요!

FAQ

Q1. Python 버전이 어떻게 되나요?
Python3.6 이상 가능합니다.

Q2. Window, MAC OS 상관 없나요?
OS는 상관 없으나 OSX 기준으로 작성되었습니다. Colab 링크를 제공해서 OS에 상관없이 학습하실 수 있도록 도움을 드릴 예정입니다.

Q3. 컴퓨터와는 관련없는 비전공자인데, 따라 갈 수 있을까요?
비전공자 분들도 이미 많이 따라오신 커리큘럼이지만 개인차가 있을 수 있습니다. 프로그래밍 경험이 전혀 없는 상태에서 재미있는 사례를 통해 프로그래밍에 대한 흥미를 갖는 것을 목적으로 하고 있습니다. 이 스터디로 자신에게 필요한 내용을 더 찾아 학습하실 수 있는 계기가 되길 바랍니다.

 

강의내용 요약

이런 분들께 추천드려요!

🎓
학습 대상은
누구일까요?
데이터 분석가에 관심있는 분
파이썬으로 데이터 시각화를 익히고자 하는 분
Pandas, NumPy 등의 파이썬 라이브러리의 기본을 익히고 싶은 분
공공데이터를 활용하고자 하는 분
데이터 저널리즘에 관심 있는 분
데이터를 통해 의미를 찾고자 하는 분
업무에 데이터 분석을 활용하고자 하는 분

안녕하세요
박조은 입니다.
박조은의 썸네일
  • Microsoft MVP(Python Developer Technologies)

  • 오늘코드 YouTube 📺 https://youtube.com/todaycode

  • “모두가 데이터에 친숙해지는 날이 오길”– 마이크로소프트웨어 (링크)

  • 네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자

  • 서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,

    한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의

  • 다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석

  • 20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험

커리큘럼 총 41 개 ˙ 5시간 33분의 수업
이 강의는 영상, 수업 노트가 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 1주차 - Chapter 0. 온라인 스터디 안내
스터디 Intro
섹션 1. 1주차 - Chapter1. 전국 신규 민간 아파트 분양가 분석
[소개] 전국 신규 민간 아파트 분양가 분석
[1/9] 신규 민간 아파트 분양가격 데이터셋 소개 13:03
[2/9] Pandas로 데이터 불러오고 요약하기 18:23
[3/9] Pandas의 groupby, pivot_table 사용하기 11:42
[4/9] 파이썬에서 pandas와 seaborn 으로 시각화 하기 15:57
[5/9] 전용면적별 데이터 시각화 barplot과 신뢰구간 95% 12:15
[6/9] Pandas로 전용면적 별 데이터 보기, 상자수염그림 Box and Whisker Plot, 박스플롯 그리기 12:11
[7/9] 2015년 이전 데이터를 가져와서 최근 데이터와 병합(concat)하기 위한 준비를 합니다. 12:25
[8/9] pandas 의 replace 기능을 활용하여 지역명을 전처리해서 데이터를 일관되게 만듭니다. 10:49
[9/9] 2013년 12월 부터 2018년까지의 데이터를 시각화 합니다. 05:13
1주차 과제 안내
1주차 과제 풀이 영상(최근 데이터 불러오기) 06:00
1주차 과제 풀이 영상(제주 외 다른 지역 시각화 하기) 04:23
섹션 2. 2주차 - Chapter2. 상가(상권)정보로 위경도 정보 활용하기
[소개] 상가 업소 정보 2018로 위경도 정보 활용하기
[1/3] 판다스로 데이터 로드하기 미리보기 10:34
[2/3] 판다스로 결측치 분석하기, ggplot 문법으로 시각화하기 11:55
[3/3] 대분류, 중분류별 요약하기 08:06
2주차 과제 안내
섹션 3. 3주차 - Chapter3. 프랜차이즈 입점 분석
[소개] 프랜차이즈 입점 분석
[1/4] read_csv로 파일 불러오기, shape로 요약보기, str.contains로 특정 상호 가져오기 10:04
[2/4] Pandas로 요약하고 gglplot 문법으로 시각화하여 업종 분석하기 06:27
[3/4] 베스킨라빈스와 던킨도너츠 위치분석 12:23
[4/4] 뚜레쥬르, 파리바게트 매장 위치 분석 09:21
섹션 4. 3주차 - Chapter4. 스타벅스, 이디야 매장위치 비교
[소개] 구별 스타벅스, 이디야 입점 분석
[1/7] Python, Pandas, folium으로 스타벅스, 이디야 매장 위치 분석하기 17:43
[2/7] Pandas의 groupby를 활용해 구별 스타벅스, 이디야 매장수 비교 10:30
[3/7] choropleth로 행정구역별 스타벅스, 이디야 매장 합계를 표현하기 17:17
[4/7] 서울 구별 스타벅스 매장 분포와 밀집도 표현하기 11:22
[5/7] 서울 구별 이디야 매장 분포와 밀집도 표현하기 08:54
[6/7] Pandas의 reshaping data 활용하여 스타벅스, 이디야 매장수 비교하기, 구별 위도/경도 평균 구하기 11:25
[7/7] Pandas의 pivot_table로 구한 데이터를 Folium의 CircleMaker로 매장수 크기를 반영해 그리기
3주차 과제 안내
섹션 5. 4주차 - Chapter5. 전국 도시공원 표준데이터 분석
[소개] 전국 도시공원 표준데이터 분석
[1/5] 전국 도시 공원 표준 데이터 불러오기, 요약하기 11:03
[2/5] 주소 및 사용하지 않는 컬럼 결측치 처리 11:32
[3/5] ggplot(plotnine)시각화 지역별, 공원구분별 시각화 08:52
[4/5] 경기도 도시공원 Folium으로 보기 09:35
[5/5] 서울, 제주 도시공원 결측치, 이상치, 오류값 분석, Folium으로 시각화 15:18
4주차 과제 안내
섹션 6. 부록
파이썬 데이터 시각화 툴인 Matplotib에서 한글폰트 사용하는 방법 08:52
강의 게시일 : 2019년 06월 05일 (마지막 업데이트일 : 2019년 07월 01일)
수강평 총 2개
수강생분들이 직접 작성하신 수강평입니다.
VIEW 추천 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
녜리짱 thumbnail
5
다양한 분석법 자세한 설명으로 들을 수 있어서 넘 좋았습니다 ^^ 또한, 매주 선생님께서 과제에 대한 공지를 해주시는데, 좀 더 긴장감이 생겨서 제한된 기간 내에 강의 수강 할 수 있었던 것 같습니다 :) ♥
2019-07-30
지식공유자 박조은
감사합니다 :) ♥
2019-07-31
딥러닝 thumbnail
5
도움이 많이 되었습니다.
2019-07-21
지식공유자 박조은
감사합니다 :)
2019-07-22