[오프라인] 뼈문과를 위한 현실 데이터 분석(12월반 모집)

[오프라인] 뼈문과를 위한 현실 데이터 분석(12월반 모집)

(0개의 수강평)

7명의 수강생
275,000원
지식공유자 · 박조은
5회 수업 · 총 0분 수업
1개월동안 무제한 시청
수료증 발급 강좌
수강 난이도 '입문, 초급'

이런 걸 배울 수 있어요

  • 판다스 기초
  • 파이썬 프로그래밍 기초
  • 파이썬으로 엑셀파일 다루기
  • 공공데이터 분석 방법
  • 파이썬 데이터 시각화
  • 파이썬 데이터 분석
  • 주피터 노트북 사용법

인프런 누적수강생 5천명 강좌를
오프라인 강좌로 재구성했습니다.

혼자 실습을 시작하기 어려우셨던 분들, 강좌를 들었지만 온라인으로는 부족함이 있으셨던 분들을 위한 강좌입니다.

매주 3시간씩 총 4주동안 인프런에 있는 콘텐츠 외에도 유튜브와 인프런을 통해 질문 주셨던 내용들을 보완하고 핵심만 골라 수업을 진행할 예정입니다.

파이썬 공부하지 마세요. 프로그래밍을 배울 때 내 길이 아닌가? 내 적성은 아닌가 하는 좌절에 빠지게 됩니다. 다른 사람의 이야기도 아니고 바로 제 이야기 였어요. 파이썬 공부하지 마세요. 프로그래밍은 배우셔야 합니다. 우리가 자전거를 배울 때 다른 사람이 자전거를 타는 모습을 아무리 많이 봐도 내가 직접 자전거를 타보고 넘어지지 않으면 배우기 어렵습니다. 수영도 마찬가지 입니다. 다른 사람들이 아무리 잘 하는 것을 많이 봐도 내가 물에 뛰어 들어 물을 먹어보기 전까지는 수영을 익히기 어렵습니다.

프로그래밍도 마찬가지 입니다. 에러를 많이 만들고 해결하는 과정에서 배우게 됩니다. 공부를 하려고 하면 어렵고 힘들때가 많습니다. 문서를 봐도 무슨 얘기인지 모르겠어요. 혼자서도 실습 해볼 수 있도록 공식 문서를 보고 따라하며 배울 수 있는 방법에 대해 알려드립니다. 점프투파이썬이라는 책에 백견이 불여일타라는 얘기가 나옵니다. 직접 코딩해 보지 않으면 아무리 다른 사람이 코딩을 하는 것을 봐도 익숙해 지지 않습니다. 스스로 실습할 수 있는 방법을 알려드립니다.

🌱 오프라인 참여안내

위치 및 장소

강남역 도보 5분거리의 스터디 공간, 수강신청 후 아래 교육과정 섹션0에서 확인 가능합니다.

요일 및 시간

1기(마감) 일요일 오전 10시~13시(10월 6일, 13일, 20일, 27일  총 4회, 매주 3시간씩 총 12시간)

2기(모집중) 토요일 오전 10시~13시(12월 7일, 14일, 21일, 28일  총 4회, 매주 3시간씩 총 12시간)

 

추가비용 여부

별도의 공간 사용료는 없습니다.

기타 메시지

개인노트북 지참이 필수이며 google colaboratory 로그인을 위한 gmail 계정과 크롬 브라우저가 필요합니다.

1회차 상가/상권 정보 분석

파이썬 실습환경

Google Colaboratory 란? 파이썬을 설치하지 않고 온라인에서 직접 실습을 하고 결과를 확인할 수 있는 Colab을 통해 실습을 진행합니다. Colab의 장점, 단점에 대해 다루며 온라인에 공개된 자료로 직접 실습해 볼 수 있는 방법을 다루게 됩니다.

 

Colab 사용법 : https://youtu.be/XRBXMohjQos 

파이썬 기초

데이터 분석을 위한 파이썬 기초를 다룹니다. 파이썬은 지난 해 스택오버플로우(프로그래밍 Q&A 사이트)에서 설문조사를 한 결과 가장 많은 응답자가 있었던 프로그래밍 언어입니다. 파이썬의 장점으로는 다른언어에 비해 배우기 쉽다는 장점과 다양한 생태계와 커뮤니티를 꼽습니다. 또, 배터리가 내장되어 있다는 얘기도 있는데 언어 자체의 표준라이브러리만으로도 우리가 풀고자 하는 문제를 푸는데 도움이 됩니다.

판다스 기초

판다스는 파이썬에서 사용할 수 있는 엑셀과도 유사한 데이터 분석 도구 입니다. 대용량 파일(기가 단위 이상)을 불러와 데이터 분석을 하고자 할 때 엑셀로는 로드가 느리거나 안 되거나 하는 현상들을 겪기도 합니다. 또 복잡한 수식이나 반복되는 작업을 처리하고자 할 때 판다스를 사용하게 되면 엑셀보다 훨씬 빠르게 데이터를 전처리 하고 분석과 시각화까지 해볼 수가 있습니다. 판다스의 기본 문법과 사용법을 익혀봅니다.

[Pandas_Cheat_Sheet.pdf](https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf)

공공데이터 활용

공공데이터 포털, 서울시 정보소통 광장, 통계청 등 다양한 곳에서 우리는 공공데이터를 가져와 업무나 연구에 활용해 볼 수가 있습니다. 공공데이터를 직접 로드해서 분석해 봅니다. 서울 구별 상점정보, 대분류, 중분류별 상점 수를 비교해 봅니다.

 

  • 파이썬 기초를 배우며, 데이터 분석과 시각화에 필요한 필수 내용만을 다룹니다.
    • 자료구조 및 형식, 변수, 문자열, 리스트, 딕셔너리, 메소드
  • 판다스 Cheat Sheet 을 통해 외우지 않고 판다스를 엑셀처럼 쓸 수 있는 방법을 다룹니다.
    • 데이터 로드, 시리즈와 데이터프레임, 데이터 타입, 요약하기, 간단한 수치계산 하기
  • 데이터 시각화의 기본
    • anscombe's quartet 데이터로 시각화의 중요성을 알아봅니다.
  • 또, 데이터를 간단하게 요약하는 방법에 대해 배웁니다.
    • 수치데이터, 범주형(카테고리)데이터에 따라 데이터를 시각화 하는 방법이 달라집니다. 데이터의 특징을 이해하고 시각화 하는 방법을 알아봅니다.

2회차 이디야 스타벅스 입지 분석

이디야는 스타벅스 근처에 입점한다는 설이 있습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 관련 기사를 읽고 구별로 이디야와 스타벅스의 매장을 기사와 유사하게 분석하고 시각화 해보면서 Python, Pandas, Numpy, Seaborn, Matplotlib 에 익숙해져 봅니다.

  • 아나콘다에 대한 개요, colab과 Jupyter Notebook의 차이점
  • 파일 로드하기, 경로설정하기(FileNotFoundError에 대처하는 방법) - https://youtu.be/xXVVKCLIie0 
  • 파이썬과 판다스의 기본 문법을 복습
  • 텍스트 데이터(주소, 상점명)등을 다루며 데이터를 나누고 합치는 정제하는 과정을 다룹니다.
  • Folium을 통해 시각화를 해봅니다.

 

3회차 2013년 부터의 아파트 분양가 데이터 분석

2013년부터 2018년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될까요? 공공데이터 포털에 있는 데이터를 Pandas 의 melt, concat, pivot, transpose 와 같은 reshape 기능을 활용해 분석해 봅니다. 그리고 groupby, pivot_table, info, describe, value_counts 등을 통한 데이터 요약과 분석을 해봅니다.

  • 전혀 다른 형태의 두 데이터를 가져와 정제하고 병합하는 과정을 다룹니다.
  • 전처리 한 결과에 대해 다양한 그래프로 시각화를 합니다.

4회차 따릉이 자전거 대여정보 분석

따릉이 자전거를 가장 많이 대여하고 반납하는 곳은 어디일까요? 또, 시간대별로 대여와 반납은 같은 곳에서 일어나고 있을까요?  또, 구별로 자전거 대여소의 수와 거치대의 수는 어떨까요? 따세권이라는 말이 등장할 정도로 따릉이 대여소가 많은 지역이 따로 있을까요? 서울 곳곳에 공유자전거 서비스인 따릉이가 있습니다. 따릉이 자전거 대여 사업은 해마다 꾸준히 증가해 오고 있는데요. 대여소별로 자전거를 대여하고 반납하는 수가 다릅니다. 서울시 정보소통광장에서 제공하고 있는 공공데이터를 바탕으로 분석을 해봅니다.

  • 시간 데이터 활용법 Pandas 는 증권사에서 퀀트를 하던 개발자가 R과 유사한 도구가 파이썬에도 있었으면 좋겠다는 아이디어에서 시작되었습니다. 그래서인지 시계열데이터를 분석하고 처리하는데 용이한 편입니다. 연월일시분초요일 등의 데이터를 가져와 분석해 보고 지역별로 자전거 대여소 수에 대한 차이를 구합니다.

오프라인 참여안내

  • 위치 및 장소 : 강남역 도보 5분거리의 스터디 공간, 수강신청 후 인프런 공지로 안내해 드립니다.
  • 요일 및 시간 : 일요일 오전 10시~13시(10월 6일, 13일, 20일, 27일 총 4회, 매주 3시간씩 총 12시간 )
  • 추가비용 여부 : 별도의 공간사용료는 없습니다.
  • 기타 메시지 : 개인노트북 지참이 필수이며 google colaboratory 로그인을 위한 gmail 계정과 크롬 브라우저가 필요합니다. 


수강 대상

  • 프로그래밍과 상관없는 도메인을 전공 업무로 하고 있지만 프로그래밍을 배워보고자 하는 분
  • 데이터 분석가
  • 반복된 엑셀 작업을 파이썬으로 자동화 하고자 하는 분
  • 코딩을 처음 접하는 사람

선수 지식

  • 분석하고자 하는 데이터가 있다면 좋습니다.

교육과정

모두 펼치기 5 강의 0분
섹션 0. 강남역 5분거리 강의장 안내
1 강의
[중요] 강의장 안내입니다.
섹션 1. 1회차 - 파이썬과 판다스 기초를 익히고 상가/상권 정보 분석하기
1 강의
섹션 2. 2회차 - 스타벅스, 이디야 입지분석
1 강의
섹션 3. 3회차 - 2013년 부터의 아파트 분양가 데이터 분석
1 강의
섹션 4. 4회차 - 따릉이 자전거 대여정보 분석
1 강의
4회차 - 따릉이 자전거 대여정보 분석

공개 일자

2019년 9월 18일 (마지막 업데이트 일자 : 2019년 9월 19일)

수강 후기

첫 수강평의
주인공이 되어주세요! ✏️