inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

따라하며 배우는 실전 스파크 Part1

셔플(개념이해)

파티션 이해하기 강의 부분 질문있습니다.

해결된 질문

104

나띵메로

작성한 질문수 8

1

강사님 안녕하세요.

파티션 이해하기 (Notebook 부분)

이 부분에서 끝 부분에 강의가 중단된 것 같은데, 혹시 rdd.getNumPartitions() 정도까지만 알고 다음 Shuffle 부분 들어도 문제 없을까요?

머신러닝 빅데이터 apache-spark 데이터-트랜스포메이션

답변 2

0

데이비드최

네, 문제 없습니다. Spark 의 동작 핵심 원리에 대한 이해를 위한 부분이며, 개념적인 이해를 돕기위한 선에서 자연스럽게 넘어가면 됩니다.

열공하세요~

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 윤님.

강의의 “파티션 이해하기” 부분에 대해 질문 주셨군요. rdd.getNumPartitions()를 이해하신 후에 다음 섹션인 Shuffle로 넘어가셔도 큰 문제는 없습니다. 그러나 RDD 및 파티션에 대한 이해는 기초적이면서도 중요하기 때문에, 이 개념이 잘 정리되어 있어야 전체적인 스파크의 데이터 흐름을 이해하는데 도움이 됩니다.

RDD(Resilient Distributed Dataset)의 파티션은 데이터셋을 분산 환경에서 처리하기 위해 중요한 역할을 합니다. 각 파티션은 데이터를 나누어 처리하고, 이를 통해 스케일을 확장할 수 있습니다. getNumPartitions() 메소드는 RDD가 총 몇 개의 파티션으로 나뉘어져 있는지를 보여주기 때문에 데이터의 병렬 처리를 이해하는 데 유용한 정보입니다.

추가로, rdd.getNumPartitions() 이후의 강의 부분은 파티션이 스파크에서 어떻게 변환되고 조작되는지를 더 깊게 이해하는 데 도움을 줄 수 있으므로, 가능하면 시청하시기를 권장드립니다. Shuffle 과정으로 넘어가더라도, 학습에 있어 큰 간극은 발생하지 않을 것입니다.

현재로서는 해당 강의에 관련된 다른 참고 링크나 자료는 없으나, Spark의 RDD 및 파티션에 대한 이해를 돕기 위해 아래 자료를 보시면 도움이 될 수 있습니다:
- Spark 공식 문서 - RDD 프로그래밍 가이드

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

타 강의 내용

0

10

1

섹션 강의 자료 문의

0

16

2

로그프레소 강의 버전관련 문의

0

14

1

26,27강 진행 간 노션, html 프롬프트 파일 불일치

0

26

3

<div id="banner">배너 이미지</div> 관련 질문

0

18

1

실습 환경 : 파이썬 3.10 관련 문의

0

19

2

kaggle notebook에 service key 설정이 누락된 것 같습니다

1

30

2

주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성

1

33

1

뒤로가기 버튼 같은 것이 있나요?

0

33

1

강의 연장 문의

0

38

1

프로그램 실행시간에 대한 질문

1

27

2

비중 및 매수 종목수 조정.

1

33

2

Claude api가 소식 동기화가 늦는 문제

1

44

2

출력값 질문

0

33

2

슬롯 관련 문의

1

31

2

kafka 라이선스 오류 문제

0

33

2

수업노트가 어디에 있나요?

0

34

1

실제 계좌 잔고 및 테스트중에

1

72

4

설치 및 설정 가이드 노션 자료는 없나요 ?

0

30

2

실기시험 제출관련

0

168

2

6.20 작업형 2 과적합

0

174

3

11강 파티션 이해하기 부분이 미완성강의네요

0

74

3

32강 강의가 짤린거 같습니다.

0

69

2

anaconda 설치

0

133

1