인프런 영문 브랜드 로고
인프런 영문 브랜드 로고
BEST
데이터 사이언스

/

데이터 분석

공공데이터로 파이썬 데이터 분석 시작하기

이디야는 스타벅스 근처에 입점한다는 설이 있었습니다. 과연 이디야와 스타벅스의 매장입지는 얼마나 차이가 날까요? 2013년부터 2019년까지 부동산 가격 변동 추세가 아파트 분양가에도 반영될까요? 우리 동네에는 어떤 공원이 있을까요? 공공데이터 포털에 있는 데이터를 어떻게 활용하면 좋을까요? 공공데이터를 통해 여러 형태의 데이터를 다뤄보며 Python과 여러 데이터분석 라이브러리에 익숙해 지는 것을 목표로 합니다.

(4.9) 수강평 324개

수강생 6,147명

Thumbnail
새소식 목록
관리
작성

상가(상권)정보 분석이 훨씬 자세해 졌습니다. 챕터1 리뉴얼에 이어 챕터2~4까지 개편 되었습니다.

상가(상권)정보 분석이 훨씬 자세해 졌습니다.

챕터1 리뉴얼에 이어 챕터2~4까지 리뉴얼이 되었습니다.  모든 영상과 소스코드를 새로 작성하였습니다.

<리뉴얼 전>

<리뉴얼 후>

챕터2 29분=>167분

챕터3 37분=>101분

챕터4 91분=>113분

지난 일년 동안 받았던 소중한 질문과 피드백을 통해 내용을 보완하고 설명을 훨씬 자세하게 추가했습니다.

또, 실습을 할 수 있는 파일과 결과 파일을 함께 제공하며 Google Colaboratory에서 바로 실습을 할 수 있는 링크도 제공합니다.

<챕터2 상가(상권)정보로 기술통계 익히기> 

missingno를 통해 좀 더 다양한 결측치 시각화를 합니다.

또, 결측치를 제거했을 때 메모리 사용량이 달라지는 점을 보고 메모리 사용량을 줄일 수 있는 방법에 대해 다룹니다.

구별 음식점 분석과 대치동과 목동에 입시학원이 많은지 가설을 세우고 분석을 해보는 내용이 추가되었습니다.

그리고 기술통계 내용을 대폭 보완했습니다.

describe를 통해 수치형, 범주형 데이터를 요약해 볼 때 각각의 값에 대한 의미와 개별 값들을 따로 계산을 해보는 과정이 추가되었습니다.

상관계수를 구하고 회귀선을 그려서 상관분석을 하는 내용도 추가되었습니다.

<챕터3 프랜차이즈 입점 분석>

다양한 변수를 시각화 하며 jointplot을 통해 2개의 수치형 변수를 시각화 하는 방법을 좀 더 자세히 다룹니다.

Folium의 CircleMarker 외에 MarkerCluster, Heatmap 으로 위치별 매장의 밀집도를 표현합니다.

<챕터4 스타벅스, 이디야 매장위치 비교하기>

CircleMarker를 구별로 그리기 위해 위경도의 평균을 구하는 과정을 for 문을 사용하지 않고 pivot_table을 통해 연산하고 merge를 통해 연산 결과를 합치를 과정을 다룹니다. 또, 설명이 훨씬 자세해졌습니다.

<챕터5> 도 곧 리뉴얼 될 예정입니다!

앞으로도 질문 혹은 수강평을 통해 의견을 남겨주시면 더 좋은 강의를 만드는데  도움이 될 것 같아요!

수강평과 피드백을 기다립니다 :)

댓글