inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

스파크 머신러닝 완벽 가이드 - Part 1

강의 소개

실습환경 문의

362

gogo91rla

작성한 질문수 7

0

안녕하세요 현재 Data Analyst로 커리어를 시작하면서 Spark 기반의 데이터 처리와 ML model deployment 경험을 쌓고자 해당 강의를 선택하게 되었습니다.

 

개발 환경에 대해 질문이 있는데 Databricks 환경이 아닌 local machine 기반의 환경에서 해당 실습을 적용해도 문제가 없을까요? 클라우드 머신 성능보다는 현재 사용하고 있는 machine의 성능이 아무래도 빠를 거 같아 질문드립니다.

(항후 다른 Kaggle 이나 개인 프로젝트 진행을 위해서 미리 개발환경 세팅을 해놓으면 좋을 것 같아서요)

제가 꼭 필요했던 강의를 찾게 되어 굉장히 기쁩니다!!

데이터 엔지니어링 apache-spark 머신러닝 배워볼래요? bigdata

답변 1

0

권 철민

안녕하십니까,

강의 내용이 목표로 하신 방향과 맞다니, 저도 기분이 좋군요.

실습 코드는 대부분 local machine 기반의 Spark에서도 수행될 수는 있지만, 몇가지 Databricks에서만 수행되는 것들이 있습니다.

만약 Spark + Zeppline을 사용하신다면 zeppline에서 dataframe을 보여주는 명령어등은 실습 코드와 다릅니다. 또 파일 시스템 접근이 조금은 상이할 수도 있습니다. 하지만 이런 정도는 인터넷 검색으로 금방 해결이 될 것입니다.

그리고 실습 중에 MLFlow도 있습니다. 이것은 Spark가 기본으로 제공하지 않기 때문에 별도의 설치 작업이 필요할 수 있습니다.

Spark가 워낙 버전이 많이 바뀌어서 어떤 버전을 사용하시느냐에 따라 차이가 발생할 수도 있지만, 이건 아마 거의 문제가 없지 않을까 싶습니다.

요약드리면 local machine에서 수행하셔도 기존 실습코드가 크게는 달라지는 부분은 없고 다른 부분이 있어도 검색등으로 쉽게 해결하실 수 있을 것 같습니다. 다만 Spark에 대한 경험이 전무하시면 이런 작은 차이들도 조금 어렵게 다가올 수도 있습니다.

감사합니다.

강사님 안녕하세요 ㅎdatabricks환경에 대한 설

0

63

3

데이터 브릭스 이슈

0

111

2

데이터 브릭스 가입

0

98

2

pyspark local 설치

0

101

2

community edition 가입 문의

0

112

2

데이터 로드 및 로딩 된 파일 데이터 목록 조회 방

0

171

2

클러스터 버전 설정

0

136

3

instacart market basket analysis

0

188

3

spark 추가 학습 관련 질문

0

235

2

MLOps 관련 MLFLow 및 Databricks 모델 서빙

0

401

1

train파일 업로드 중에 해당 경로가 없다고 뜹니다

0

376

2

강의가 재생되지 않음

0

266

2

후속 강의 계획 질문드립니다.

0

373

1

spark_xgboost_lightgbm 강의부분 관련

0

476

1

spark환경에서 데이터 수정에 관하여 질문이 있습니다.

1

327

1

Spark를 이용하여 binary file -> parquet, csv 변환 가능여부

0

573

1

SPARK 2 강의 오픈

0

499

1

Spark ML 모델 서빙

0

571

1

mac os ) zip 파일 dataframe 오류

0

674

1

ModuleNotFoundError : No module named 'mmlspark' - 20230218

0

631

1

TrainValidationSplit과 randomSplit 사용 질문

0

403

1

현업에서는 scala-spark를 사용하나요? py-spark를 사용하나요?

0

518

1

cluster 생성 Database runtime version 질문

0

277

1

Pandas vs Spark: 비용, 처리시간 비교

0

1239

1