파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
투자 강의가 아닙니다. 증권 데이터를 통한 데이터 수집, 분석과 시각화를 다룹니다. 다양한 데이터 포맷을 다루며 다양한 텍스트 전처리 기법을 익힙니다. 시계열 데이터의 시각화 기법과 스케일에 대한 표현 방법 주가 데이터를 해석하기 위한 몇 가지 기법을 다룹니다. 이 강의는 데이터 분석을 통해 인사이트를 얻는 방법을 알아가는 강좌입니다. 주가 데이터를 통해 배운 내용을 시계열이 활용되는 수요량, 재고량, 판매량, 트래픽량 등의 데이터를 수집, 분석, 시각화에 활용해 볼 수 있도록 구성 되어있습니다.
초급자를 위해 준비한
[데이터 분석] 강의입니다.
이런 걸
배워요!
크롤링이 아닌 웹 스크래핑
FinanceDataReader 를 통한 진짜 한 줄로 주가 정보 수집하기
판다스 코드 한 두 줄로 데이터 수집하기
브라우저의 네트워크탭 이해를 바탕으로 복잡한 코딩 없이 데이터 수집하는 방법
JSON 파일 포맷 다루기
시계열 데이터 다루기와 diff, shift를 통한 다양한 연산 알아보기
주가의 일별 수익률과 누적 수적 수익률 구하기
seaborn, plotly, pandas plot, matplotlib 의 차이와 사용방법
plotly, cufflinks를 통한 인터랙티브 시각화 기법
판다스의 filter, merge, concat, text 전처리 방법
ETF, 업종/테마 전종목을 수집하고 분석하는 방법
볼린저밴드, MACD, RSI 등의 보조지표 구현과 원리 이해
주린이를 위한 PER, EPS, BPS, PBR, ETF, 인버스, 레버리지, 환헤지 등의 용어 이해
증권 데이터로 배우는 데이터 A to Z,
수집 - 분석 - 시각화까지 익혀보세요!
데이터 속에서
신호와 소음 찾고,
더 많은 인사이트를! 📈
여러분, 혹시 <신호와 소음>이라는 책 알고 계신가요?
우리는 데이터 분석과 시각화를 통해 불확실한 미래를 예측하고, 인사이트를 찾으려 합니다.
그렇기 때문에 수많은 데이터 속 신호와 소음을 찾아내는 것이 데이터 분석가가 할 일이죠.
이 강의는 바로 그런 관점에서 출발합니다.
바로 지금도 오르고 내리는 증권 주가 데이터를 실시간으로 받아와 분석하는 것인데요.
이 강의에서는 데이터 수집/전처리 - 분석 - 시각화의 3단계를 거쳐,
- 누군가 수집해 준 데이터를 사용하는 대신 데이터를 직접 수집하고, 전처리 하는 방법을 알아봅니다.
- 업무나 연구에 사용할 데이터 분석 방법을 익히고 적용해 보는 것을 목적으로 하고 있습니다.
데이터 분석,
왜 증권 데이터로
배워야 할까요? 📊
- 수십, 수백 페이지의 웹 사이트의 내용을 엑셀에 복붙해야 한다면?
- 수집한 데이터가 너무 지저분해서 어디부터 손을 대야 할지 모르겠다면?
- 중학교 때 배운 통계 용어, 어떻게 적용해야 될지 모르겠다면?
👉 공감했다면, 지금이 바로 데이터 기초 체력을 기를 때입니다!
파이썬 데이터 분석 라이브러리, Pandas가 증권가에서 일하는 퀀트에 의해 개발되었다는 사실 알고 계신가요? 증권 데이터는 다양한 분석 방법, 수식, 통계 등을 적용해 볼 수 있는 데이터입니다.
범주형 데이터, 수치형 데이터가 어떤 차이가 있는지,
데이터의 신호와 소음을 찾기 위한 적절한 시각화 방법은 무엇인지...
증권 데이터를 분석하면, 다양한 포맷의 데이터를 다루는 방법을 익혀볼 수 있습니다.
증권 데이터 분석으로 기르는
데이터 기초 체력.
- ✅ 이동평균, 볼린저밴드, MACD, RSI와 같은 기술적 분석을 직접 구현해 보기도 하고
- ✅ 이미 구현된 라이브러리를 통해 코드 한 두 줄로 차트를 그려보기도 합니다.
- ✅ 기술적 분석에 대한 원리를 이해하고 HTS나 MTS에서 보는 것처럼 차트를 구현해 봅니다.
누가 배우면 좋을까요? 🔍
살아있는 데이터로
데이터 분석을
익히고자 하는 분
파이썬을 이용한
데이터 분석에
입문하고자 하는 분
데이터를 수집하고
전처리하는 방법을
익히고자 하는 분
볼린저밴드, MACD,
RSI 등 보조지표를
구현/분석하고픈 분
📢 선수 지식을 확인해주세요!
- 본 강의는 초급 이상 수준의 강의로, 다음과 같은 선수 지식이 필요합니다.
- 엑셀 형태의 표를 읽는 방법(행과 열의 이해)
- 기본적인 사칙연산과 중학교 수준의 수학지식
- 평균, 중앙값, 백분율, 분산, 표준편차에 대한 이해
- 파이썬의 문자열, 숫자, 리스트, 변수에 대한 이해
이 강의만의
핵심 특징을 알려드려요. ⚡️
하나, 코드 한 두 줄로 데이터 수집 🧹
셀레니움과 같은 무거운 도구를 사용해야만 수집할 수 있을 것 같았던 웹 페이지의 데이터를 브라우저의 네트워크 탭을 활용해서 코드 한 두 줄로 수집할 수 있는 방법을 알아봅니다. 업무나 연구에 필요한 정보를 직접 수집하고 분석해 볼 수 있습니다.
둘, 동적 시각화 도구도 OK. 📈
이 강의에서는 정적인 시각화 도구뿐만 아니라 동적인 시각화 도구의 사용법을 익혀봅니다. 동적인 데이터 시각화를 통해 정적인 시각화 도구만으로 데이터를 표현할 때보다 더 광범위하고 복합적인 정보를 효과적으로 전달하고 구현할 수 있게 될 거예요.
셋, 숲을 보는 능력을 길러드려요 🧰
많은 도구를 한 번에 익히려면 어렵습니다. 핵심 기능만 이해하면 돼요. 툴이 바뀌더라도 문서를 보고 이해할 수 있는 방법을 알면 새로운 라이브러리가 등장해도 두렵지 않을 거예요.
넷, 편리하게 활용하는 라이브러리! 💡
우리가 필요하다고 느끼는 기능은 누군가 추상화된 라이브러리로 만들어 놓았어요. 새로운 도구를 설치하고 익혀보는 방법을 알아봅니다. 실제로 데이터를 분석할 때 편리하게 활용할 수 있어요.
다섯, 알찬 실습 자료를 제공해요. 💻
코드가 입력되지 않은 파일(input)과 입력된 파일(output) 2가지 실습자료를 제공합니다. 설명이 적힌 빈 셀에 직접 코드를 입력하며 강의를 따라해볼 수도, 코드가 적혀있는 파일을 통해 실행하며 실습을 진행하거나 강의를 다 듣고 빈 셀을 채우며 복습할 수도 있습니다.
여섯, 기술적 분석 + 보조지표까지! 📖
증권사 HTS, MTS에서 볼 수 있는 여러 가지 보조지표(이동평균, 볼린저밴드, RSI, MACD...)를 시각화한 차트에 직접 구현, 표시해 보면서 원리를 이해할 수 있는 과정이 포함되어 있습니다. 각종 보조 지표를 직접 구현하고 분석하는 법을 익히고 싶은 분들께 도움이 됩니다.
코드가 입력되지 않은 파일(input)과 입력된 파일(output) 2가지 실습자료를 제공
HTS, MTS 에서 볼 수 있는 보조지표(이동평균, 볼린저밴드, RSI, MACD) 직접 구현하고 원리 이해하기
강의 하나로
이렇게 많은 스킬을
배울 수 있어요. 📌
이 강의로 배우는 스킬 한 줄 소개!
- 🐼 Pandas : 파이썬의 대표적인 데이터 분석 도구로 금융 데이터 분석을 위해 만들어졌습니다.
- 🧮 Numpy : 파이썬의 수치계산 도구입니다.
- 📊 matplotlib : 파이썬의 대표적인 데이터 시각화 도구입니다.
- 📊 seaborn : matplotlib을 사용하기 쉽게 추상화 해 놓은 고수준 시각화 도구로 기본 통계 연산을 제공합니다.
- 📊 plotly : 고수준, 저수준 시각화 기능을 제공하며 인터랙티브한 시각화가 가능합니다.
- 📊 cufflinks : plotly와 pandas를 강력하게 이어주는 생산적인 도구입니다.
- 📈 FinanceDataReader : 코드 한 두 줄로 금융 데이터를 수집할 수 있는 도구입니다.
- 🌏 Requests : 웹 페이지의 소스코드를 HTTP 통신으로 받아올 수 있는 도구입니다.
- 🔍 BeautifulSoup4 : 웹 페이지의 소스코드에서 원하는 정보를 가져올 수 있는 도구입니다.
- ⏰ tqdm : 데이터 수집이나 전처리에서 오래 걸리는 작업의 진행 상태를 볼 수 있습니다.
궁금한 내용을
먼저 확인해보세요! 🙋♀️
Q. 비전공자도 들을 수 있나요?
데이터 분석은 전공/비전공을 불문하고 익혀두면 활용할 곳이 많습니다. 엑셀대신 파이썬을 통한 데이터 분석 기법을 익혀두면 업무와 연구에 다양하게 사용해 볼 수 있어요. 이미 해당 내용으로 오프라인 커리큘럼을 통해 개발 외 직군에 기업강의를 진행한 바 있습니다. 현장에서 어려움을 느끼는 부분에 대해 다양한 인터뷰를 진행하고 커리큘럼을 보완했습니다. 분석과 시각화를 위한 핵심기능을 익히면 업무 효율을 높이는데 도움이 됩니다.
Q. 왜 파이썬으로 데이터 분석과 수집 기술을 배워야 하나요?
엑셀은 어떤 업무를 하든 직장인의 필수 스킬 중 하나입니다. 하지만 엑셀로는 불러올 수 있는 데이터의 크기나 타입 등 한계가 있지만 파이썬을 통해 익히게 되면 다양한 포맷과 대용량 데이터도 다룰 수 있게 됩니다.
Q. 데이터 분석과 수집 기술을 배우면 무엇이 좋은가요?
필요한 데이터를 수집하기 위해 페이지마다 넘겨가며 드래그드랍과 복사붙여넣기를 통해 반복된 작업을 해야할 일들이 종종 발생합니다. 이런 일은 이제 파이썬에게 맡기고⏰ 좀 더 생산적인 일에 시간을 투자하거나 휴식🧘♀️을 취할 수도 있을거에요.
Q. 강의를 듣기 전 준비해야 할 것이 있나요?
파이썬의 변수, 숫자, 문자, 리스트 등의 개념을 이해하고 있으면 도움이 됩니다. 또, 평균, 중앙값, 분산, 표준편차, 백분위 등 중학교 수준의 수학 지식이 필요합니다.
Q. 수업 내용을 어느 정도 수준까지 다루나요?
증권 데이터를 수집, 전처리, 분석, 시각화 합니다. 파이썬의 기초부터 중급까지의 스킬을 다룹니다. 업종테마 정보 수집부터는 난이도가 많이 올라갑니다. 기획, 마케팅, 영업, 운영 등 다양한 직군에서 데이터 분석을 직접 활용해 볼 수 있는 것을 목표로 합니다. 프로그래밍이 처음이라면 강의 중반 부터는 어렵게 느껴질 수도 있습니다. 이럴 때는 강사가 제공하고 있는 자료 중 파일명 끝에 output이라는 이름을 가진 완성된 파일을 돌려보고 바로 아래에 코드셀을 만들어서 똑같이 따라 해 보는 것을 추천합니다.
Q. 컴퓨터의 성능은 어느정도 되어야 수강 할 수 있나요?
4GB 이상의 메모리와 남은 저장공간이 20GB 정도 되는 PC나 노트북이라면 상관 없으며 컴퓨터의 성능이 낮다면 google colaboratory를 통해 실습해 보실 수 있습니다.
Q. 수업 내용을 개인 블로그나 깃헙에 정리해서 공개해도 되나요?
해당 강의 깃헙에 저작권 표기가 되어 있습니다. 정리해서 공개할 때는 출처 표기를 해주세요.
수강 전 확인해주세요! ⚠️
ARIMA 등의 시계열 모델이나 머신러닝 혹은 딥러닝을 통한 예측을 원하는 분:
데이터 수집, 전처리, 분석, 시각화를 주로 다룹니다. 미래의 데이터를 예측하는 과정은 없습니다.
자동매매를 원하는 분:
자동매매 관련 증권사 API는 사용하지 않습니다.
데이터 분석을 익히면 증권시장에서 큰 수익을 얻을 수 있을 것이라 기대하시는 분:
이 강의는 증권 투자 강의가 아니라 데이터 분석 강의입니다. 아쉽게도 투자와 관련된 스킬을 기대한다면 실망할 수 있습니다. 또, 강의에서 배운 분석 기법을 통해 투자를 하였다 하더라도 투자 손실에 대한 책임은 투자자에게 있습니다.
인프런 미리보기 또는 유튜브 채널을 통해 공개된 일부 수업을 먼저 듣고 수강 여부를 결정해 주세요.
수강 전 일부 수업을 미리 볼 수 있습니다. 원하는 학습 방향인지 확인해 보세요. 또 궁금한 사항은 수강 전 문의를 통해 질문해 주세요.
이 강의를 만든
지식공유자가 궁금하다면? 👩💻
지식공유자 박조은 X 인프런 인터뷰
이런 분들께
추천드려요!
학습 대상은
누구일까요?
투자 목적보다는 증권 데이터로 분석과 시각화를 익히고자 하는 분
살아있는 데이터를 통해 데이터 분석을 익히고자 하는 분
파이썬 데이터 분석에 입문하고자 하는 분
데이터 수집 방법을 익히고자 하는 분
수집한 데이터를 전처리하는 하는 방법을 익히고자 하는 분
볼린저밴드, MACD, RSI 등의 보조 지표를 직접 구현하고 분석하는 방법
선수 지식,
필요할까요?
엑셀 형태의 표를 읽는 방법(행과 열의 이해)
기본적인 사칙연산과 중학교 수준의 수학지식
평균, 중앙값, 백분율, 분산, 표준편차에 대한 이해
파이썬의 문자열, 숫자, 리스트, 변수에 대한 이해
안녕하세요
박조은입니다.
Microsoft MVP(Python Developer Technologies)
네이버 커넥트 재단 부스트코스 데이터사이언스 강의 설계 및 교수자
서울대 빅데이터혁신공유대학, 서울대 평생교육원, 연세대 DX Academy, 한신대 ABC Camp, 한양대 대학원, 전남대,
한국능률협회, 삼성SDS 멀티캠퍼스, 멋쟁이사자처럼, 패스트캠퍼스, 모두의연구소 등 다수의 교육기관 및 기업 강의
다양한 도메인(제약, 통신, 자동차, 커머스, 교육, 정부기관 등)의 기업 데이터 분석
20년이상 게임, 광고, 교육 등 다양한 도메인에서 웹 백엔드 개발자 및 데이터 분석가 현업 경험
커리큘럼
전체
121개 ∙ 21시간 43분
수업 자료
가 제공되는 강의입니다.
마지막 업데이트일: 2022년 11월 21일