실리콘밸리 리더가 알려주는 빅데이터 처리 (Spark)
한기용
빅데이터를 처리한다는 것은 Pandas로 데이터를 처리하는 것과 무엇이 다를까요? 빅데이터 처리의 필수 프레임워크인 Spark에 대해서 배워볼까요?
Basic
Apache Spark, pyspark, Pandas
데이터를 하는 사람이라면 꼭 알아야하는 기본 기술은 SQL입니다. 이번 강의에서는 SQL을 데이터 분석이란 관점에서 실습 위주로 학습해보겠습니다. 실습은 DuckDB를 가지고 Google Colab에서 진행합니다.

SQL 문법 및 SQL을 사용한 데이터 분석 능력
DuckDB라는 데이터 웨어하우스 사용 방법
학습 대상은
누구일까요?
데이터 분석가, 데이터 엔지니어, 데이터 과학자
직군 상관없이 데이터 분석을 해야하는 분
선수 지식,
필요할까요?
SQL SELECT를 사용해본 경험
933
명
수강생
58
개
수강평
34
개
답변
4.9
점
강의 평점
5
개
강의
컴퓨터 공학 석사 후 삼성전자에서 시작된 커리어가 친구덕에 실리콘밸리로 이어져 지난 29년간 13개의 다양한 스테이지의 회사를 다녔습니다 (창업, 대기업들, 다수의 스타트업들).
야후: 엔지니어링 디렉터로 검색엔진 개발.
유데미. 데이터팀을 처음 만들어 30명까지 성장. 2021년 10월에 나스닥 상장
삼성전자
...
중간에 11개월 쉬어보기도 했고 본의 아니게 엔젤투자자(Chartmetric, Goodtime.io, Select Star, EO, 비지니스 캔버스, ...), 어드바이저(몰로코, 블라인드, 월급쟁이부자들, ...), 컨설팅(SK텔레콤, 현대카드, 이마트 등등) 등의 역할을 하면서 나만의 브랜드를 만들었습니다. 실패를 실패가 아닌 교훈으로 보는 긍정의 힘과 꾸준함이라는 복리의 힘을 믿습니다.
전체
38개 ∙ (7시간 6분)
3. 데이터 팀의 미션과 가치 창출
13:40
4. 관계형 데이터베이스란?
16:41
5. SQL이란?
08:59
6. 데이터 웨어하우스 소개
10:40
7. DuckDB 소개
11:06
8. 실습용 예제 테이블 소개
19:17
9. DuckDB 실습환경 셋업
13:54
전체
4개
5.0
4개의 수강평
수강평 22
∙
평균 평점 4.8
5
정말 많이 배운 강의였습니다. 항상 DBA 가 하는 데이터 분석은 어떤 일인지 막연히 궁금했는데, 역할에 대한 생각을 넓힐 수 있는 기회였습니다. 모르고 썼던 SQL 도 더 알게 되었고요. 특히, 세션으로 채널 분석하는 건 정말 흥미러웠습니다. 저렇게 데이터를 수집하는구나..!! 아직 주니어 레벨이라 그런지, 너무 새롭고 재밌었습니다. 더 열심히 배워보겠습니다. 감사합니다 기용님!!
자세한 수강평 감사드립니다. 만일 데이터 수집쪽으로 관심있다면 Airflow 강의도 추천드립니다. Python 지식이 좀 필요한데 ChatGPT 등에게 물어보며 학습한다면 생각보다 그리 어렵지 않으리라 믿습니다. 응원합니다!
수강평 164
∙
평균 평점 5.0
수강평 3
∙
평균 평점 5.0
5
데이터 관련 공부를 하신다면 이 강의를 0순위로 설정하셔서 공부하시면 좋을 것 같습니다...!! SQL을 왜 배우는지, 각각의 문법의 역할이 무엇을 하는지, 모를 때 어떻게 해야할 지 등 입문 혹은 초급 입장에서 가려운 부분을 잘 긁어주시는 좋은 강의 입니다!!
감사합니다! 혹시라도 궁금한 부분 생기면 질문 부탁드리겠습니다. 그리고 3주전에 Airflow 강의도 하나 올렸습니다. 2주후에 Spark 강의도 하나 올릴 예정이고 검색엔진과 추천엔진과 AB 테스트에 관한 강의들을 계속 해서 올릴 예정입니다. 계속된 관심 부탁드리겠습니다.
월 ₩14,300
5개월 할부 시
₩71,500
지식공유자님의 다른 강의를 만나보세요!
같은 분야의 다른 강의를 만나보세요!