"따라하는 실전 Spark Part 1"은 데이터 사이언스를 처음 접하는 학습자부터 Spark를 활용한 실무 프로젝트를 준비하는 실무자까지 모두를 대상으로 설계된 실전 중심의 강의입니다. 이 강의는 Spark의 기본 개념부터 실무 활용법까지 체계적으로 학습할 수 있도록 구성되어 있으며, 특히 Spark 프로젝트 수행에 필수적인 명령어와 데이터 처리 방법을 중점적으로 다룹니다.

@Apache Spark, @빅데이터, @머신러닝, @데이터 엔지니어링, @데이터 트랜스포메이션

강의 목표

Spark의 기본 원리와 환경 설정: Spark의 동작 원리와 환경 구성 방법을 익혀 로컬 및 Docker 환경에서 효율적으로 활용할 수 있습니다.
분산 데이터 처리와 최적화: Spark의 분산 처리 개념과 데이터 파티션, 셔플, 클러스터 리소스 구성 등을 실습하며, 대규모 데이터 처리의 기초를 다집니다.
실무 중심 데이터 처리 기술 습득: 다양한 Spark 명령어를 통해 데이터를 로드, 변환, 필터링, 조합하며, 고급 데이터 처리 기법을 학습합니다.
데이터 분석과 시각화 능력 배양: Spark의 데이터 프레임과 SQL 명령을 활용해 데이터를 분석하고, 결과를 시각화합니다.

커리큘럼 구성

오리엔테이션
- Spark의 개념과 실무 활용 가능성을 소개하고, 학습 방향을 제시합니다.
Spark 환경 구성
- 로컬 환경 및 Docker를 활용한 Spark 설치와 설정 방법을 익혀 실습 환경을 구성합니다.
분산 처리 개념
- Spark가 대규모 데이터를 처리하는 방식과 분산 처리의 기본 원리를 학습합니다.
Spark 동작 이해
- Lazy Operation, 파티션, 셔플 등의 핵심 동작 원리를 Jupyter Notebook과 Spark UI를 통해 시각적으로 이해합니다.
실전 Spark 필수 명령어
- 데이터 로딩, 날짜 필터링, join, aggregation, UDF 활용, 데이터 저장 등 실무에서 자주 사용되는 명령어를 익힙니다.
- SQL 명령을 효율적으로 활용하는 방법도 포함됩니다.
고급 데이터 처리
- 문자열 데이터 처리, null 값 처리, JSON 데이터 다루기, 파티션 최적화 등 실무에서 흔히 접하는 문제를 다루는 고급 기술을 학습합니다.

이런 분들께
추천드려요

학습 대상은
누구일까요?

스파크를 처음 접하는 사람
스파크 기업 프로젝트를 수행하고 싶은 사람

선수 지식,
필요할까요?

파이썬 기초(아주 낮은 수준)

안녕하세요
데이비드최입니다.

176

명

수강생

개

수강평

개

답변

4.9

점

강의 평점

개

강의

현재 대기업 중심으로 아래와 같은 프로젝트의 개발책임 및 컨설팅을 맡고 있습니다. 현역^^입니다.

더불어, 고려대 대학원에서 인공지능 관련 겸임교수로도 활동하고 있습니다.

저의 목표는 실전에 바로 써먹을 수 있는 현장감 있는 프로그래밍 기술입니다. 앞으로 많은 여러분과 함께 재미난 수업 만들어 나가고 싶습니다.

엔터프라이즈 인공지능 구조 및 서비스 설계
머신러닝 서비스 구현
벡엔드 서비스 개발
클라우드(Azure) Databricks, ETL, Fabric 등 각종 클라우드 환경에서의 데이터베이스 구축 및 서비스 개발

커리큘럼

전체

48개 ∙ (10시간 33분)

섹션 1. 오리엔테이션

1개 ∙ (2분)

1. 오리엔테이션
02:54

섹션 2. 스파크 환경 구성

3개 ∙ (28분)

섹션 3. 분산 처리 개념 이해

1개 ∙ (20분)

5. 분산 처리
20:11

섹션 4. 스파크 동작 이해

12개 ∙ (2시간 35분)

섹션 5. 따라하는 실전 스파크 필수 명령들

13개 ∙ (2시간 49분)

섹션 6. 따라하는 실전 스파크(고급편: 데이터 처리)

17개 ∙ (4시간 14분)

섹션 7. 실전 스파크 파트1 마무리

1개 ∙ (1분)

강의 게시일: 2025. 01. 19.

마지막 업데이트일: 2026. 02. 17.

수강평

전체

1개

5.0

1개의 수강평

서지우
수강평 1
∙
평균 평점 5.0
2026. 03. 25.
5
100% 수강 후 작성
실전스파크 파트2는 어디에있나요!

데이비드최님의 다른 강의

지식공유자님의 다른 강의를 만나보세요!

진짜 현장에서 통하는 OCR, 이렇게 만듭니다.

데이비드최

현업에서 진짜 쓰이는 OCR 기술, 제대로 배워보고 싶다면 이 강의 하나로 끝! 비정형 문서와 복잡한 레이아웃에서도 98% 이상의 정확도를 목표로, 최신 SOTA 모델과 실전 노하우를 바탕으로 기업 수준의 OCR 프로젝트를 함께 만들어갑니다.

초급

Python, 인공지능(AI), openai

진짜 현장에서 통하는 OCR, 이렇게 만듭니다.

데이비드최

컴퓨터 비전 이상 탐지, 개발부터 배포까지 올인원 마스터

데이비드최

🚀 데이터브릭스로 배우는 실전 AI 이상 탐지! 💡 비싸고 느린 모델은 그만! 대규모 데이터 최적화부터 실시간 배포까지, 기업 실무에서 바로 활용할 수 있는 이상 탐지 AI를 완성합니다.

중급이상

Python, 인공지능(AI), 머신러닝

컴퓨터 비전 이상 탐지, 개발부터 배포까지 올인원 마스터

데이비드최

비슷한 강의

같은 분야의 다른 강의를 만나보세요!

스파크 머신러닝 완벽 가이드 - Part 1

권 철민

스파크(Spark) 머신러닝의 핵심 Framework에 대한 이해, 난이도 높은 실전 문제를 통한 SQL 기반의 데이터 가공, 업무 도메인 분석을 통한 데이터 분석과 최적화된 머신러닝 모델 구현 능력까지, 대용량 데이터 기반에서 머신러닝 전문가로 인정 받고 싶다면 이 강의와 함께 하십시요.

중급이상

Apache Spark, 머신러닝, 빅데이터

스파크 머신러닝 완벽 가이드 - Part 1

권 철민

Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기

Billy Lee

하둡과 빅데이터를 배우고자 하는 수강생들은 이 과정을 통해 빅데이터 세계를 경험하는 놀라운 발전을 기념할 것입니다!

초급

빅데이터, Hadoop, 데이터 엔지니어링

Data Engineering Course (1) : 빅데이터 하둡 직접 설치하기

Billy Lee

업무에 바로 써먹는 데이터 마인드(데이터 리터러시) 향상 방법

한국사회능력개발원

데이터 분석 경험도 별다른 기술도 없는 기획자, 마케터가 가장 기초적인 수준에서 데이터 분석을 해볼 수 있는 방법을 다양한 사례와 함께 알려 드립니다. 여러 해 동안 100여 개 기업과 공공기관 등에서 2천여 명에 이르는 수강자들과 함께 실습하며 데이터 비전문가 입장에서 가장 현실적으로 활용 가능한 분석법으로 내용을 구성했습니다.

입문

데이터 리터러시, 빅데이터, 머신러닝

업무에 바로 써먹는 데이터 마인드(데이터 리터러시) 향상 방법

한국사회능력개발원

[멘토링] 데이터로 미래를 그리다: 모두를 위한 데이터 리터러시

한기용

데이터에 관심있는 개인이나 리더를 대상으로 데이터 팀이 하는 일을 소개하고 조직의 데이터 활용 능력을 나타내는 데이터 문해력이 어떤 것인지 소개합니다.

입문

데이터 리터러시, 데이터 엔지니어링, 데이터 트랜스포메이션

[멘토링] 데이터로 미래를 그리다: 모두를 위한 데이터 리터러시

한기용

3D 공간정보 데이터 취득과 빅데이터 시각화

한국사회능력개발원

드론, 라이다 등을 활용한 3D 공간정보 데이터 취득과 매핑방법, 3D 공간정보 데이터의 활용분야에 따른 데이터 시각화 도구와 방법을 다양한 사례와 접목하여 알려 드립니다.

입문

3d-modelling, 빅데이터

3D 공간정보 데이터 취득과 빅데이터 시각화

한국사회능력개발원

[관리코스 #3] DE, DBA (SSIS, SSAS, MachineLearning, BI, ETL)

개발자Park

SSIS, SSAS, MachineLearning, BI, ETL. 국내의 도서, 유튜브, 강의, 블로그, 학원에서 찾아볼 수 없는 중요한 기술을 배울 수 있습니다. 국내 대기업, 미국 대기업 및 미국 주정부 자금 지원 기관 취업에 관심 있는 분들께도 추천해요.

초급

빅데이터, ssis, ssas

[관리코스 #3] DE, DBA (SSIS, SSAS, MachineLearning, BI, ETL)

개발자Park

기계학습 파이프라인(Machine Learning Pipeline)

국립부경대학교 소프트웨어융합혁신원

데이터를 기반으로 문제를 정의하고, 그 판단 근거와 의사결정 과정을 명확하게 설명하는 능력을 기르게 된다. 또한 단일 모델의 성능에만 집중하는 것이 아니라, 머신러닝 워크플로 전체의 완성도와 신뢰성을 평가하는 파이프라인 관점의 사고를 갖추게 된다. 아울러 오류가 발생했을 때 그 원인을 역추적하고 개선 방향을 도출하는 문제 해결 능력을 강화하며, 엔드투엔드 프로젝트 수행 경험을 통해 현업에 즉시 적용 가능한 실무형 ML 파이프라인 역량을 습득하게 된다.

초급

머신러닝, 인공지능(AI), Python

기계학습 파이프라인(Machine Learning Pipeline)

국립부경대학교 소프트웨어융합혁신원

R을 활용한 빅데이터 및 통계분석

한국사회능력개발원

R프로그래밍을 이용해 누구나 빅데이터 분석을 할 수 있도록 데이터의 기본적인 개념, R의 유용한 함수와 패키지, 데이터 분석 실습을 담았습니다.

입문

R, 빅데이터

R을 활용한 빅데이터 및 통계분석

한국사회능력개발원

데이터입문자를 위한 Azure 데이터 기초 완전정복

이상희강사

Microsoft AZ-900 자격을 동시에 대비 할 수 있는 이론적 토대를 마련 할 수 있는 특강이며 2025년 5월 기준의 출제 범위를 반영한 최신 콘텐트로서 핵심 데이터 개념 ,Azure의 관계형 데이터 ,Azure의 비관계형 데이터,Azure의 분석 워크로드에 관련된 내용을 이론과 실습이 겸비된 형태로 제공함으로서 자격증 취득은 물론 데이터 전문가로의 첫걸음 다지는 의미있는 교육 기회로 활용 할 수 있습니다

입문

SQL, 빅데이터, 데이터 엔지니어링

데이터입문자를 위한 Azure 데이터 기초 완전정복

이상희강사

토스 개발자와 함께하는 Data Workflow Management 기반의 대용량 데이터 처리 설계 패턴

Hong

Apache Airflow를 활용한 데이터 파이프라인 구축 과정을 기초부터 실전까지 학습합니다. Airflow의 핵심 개념과 아키텍처를 이해하고, 동적 DAG, 병렬 처리, 분산 처리, Custom Operator 등 실무에서 자주 활용되는 고급 설계 패턴을 실습을 통해 익힙니다. Python과 Docker로 실습 환경을 구성하며, 실제 워크플로우를 설계하고 운영할 수 있는 실전 역량을 기릅니다.

초급

빅데이터, Docker, docker-compose

토스 개발자와 함께하는 Data Workflow Management 기반의 대용량 데이터 처리 설계 패턴

Hong

모르면 승진 안되는 데이터 아키텍처의 정석

미쿡엔지니어

데이터 시대, 진정한 가치를 발견하라! 📊 데이터에 집중된 어플리케이션 설계는 이제 필수가 되었습니다. 최신 트렌드와 실무 중심의 사례로 회사가 원하는 인사이트와 실력을 키워보세요. 효율적인 데이터 처리와 설계 비법, 지금 바로 시작하세요! 당신의 다음 스텝, 데이터 중심의 세계로 도약하세요!

초급

빅데이터, 아키텍처, 데이터 엔지니어링

모르면 승진 안되는 데이터 아키텍처의 정석

미쿡엔지니어

[2026] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이

알고런 데이터코드 연구소

공부는 했지만 문제를 풀지 못하는 당신을 위한 SQLD 노랭이 176 문제 풀이 강의. 완강 후 합격을 넘어 전문가가 됩니다. SQLD 올인원패스!

초급

SQL, 빅데이터, Oracle

[2026] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이

알고런 데이터코드 연구소

따라하며 배우는 실전 스파크 Part1

수강 후 이런걸 얻을 수 있어요

따라하는 실전 Spark Part 1

강의 소개

강의 목표

커리큘럼 구성

누구를 위한 강의인가요?

수강 후 기대 효과

이런 분들께
추천드려요

안녕하세요
데이비드최입니다.

커리큘럼

수강평

데이비드최님의 다른 강의

비슷한 강의

따라하며 배우는 실전 스파크 Part1

수강 후 이런걸 얻을 수 있어요

따라하는 실전 Spark Part 1

강의 소개

강의 목표

커리큘럼 구성

누구를 위한 강의인가요?

수강 후 기대 효과

이런 분들께 추천드려요

안녕하세요 데이비드최입니다.

커리큘럼

수강평

데이비드최님의 다른 강의

비슷한 강의

이런 분들께
추천드려요

안녕하세요
데이비드최입니다.