Learn Python Apache Spark from Silicon Valley Engineers

Reading CSV files into a DataFrame

parquet read시 partition 개수

2023-02-09T07:33:52.686Z

439

satelites90719

27 asked

안녕하세요

parquet을 read할때, 파티션 개수는 저장할때의 partition으로 고정될까요??

parquet을 read 할때 partiton 1개당 size가 너무 커서, partiton 개수를 늘려서 read 하고 싶습니다. 혹시 방법이 있을까용?

감사합니다.

머신러닝 머신러닝 배워볼래요? 빅데이터 bigdata apache-spark

Answer 1

altoformula

2023-02-09T07:45:04.462Z

네 제가 알기론 아쉽게도 없습니다. 저장을 그렇게 크게한 파이프라인을 바꾸셔야 돨 듯합니다. 일단 파일 수 자체가 작기 때문에 읽을때도 뭐 그대로 처음부터 그파티션들만 읽어야줘. 방법이 없습니다.

satelites90719

2023-02-09T08:13:32.155Z

명쾌한 답변 감사합니다 ㅎㅎ

databricks에 cluster 메뉴가 없습니다.

2026-03-07T14:26:04.016Z

주피터 사용 및 도커 설치

2026-02-23T10:35:47.151Z

134

S3 폴더 구조에 따른 Static Partition Pruning, DPP 질문

2025-10-28T08:07:58.715Z

112

broadcast Join과 boradcast + UDF 차이

2025-10-20T11:20:08.128Z

append 모드 사용 시 집계

2025-09-27T11:59:52.088Z

CDC 기반 스파크 아키텍처 구현 방법이 궁금합니다.

2025-09-18T23:53:58.617Z

145

BroadCast 지원 가능 메모리 문의

2025-03-10T14:14:20.054Z

113

rdd, dataframe, spark sql 각각 언제 사용할까요?

2025-01-16T10:54:54.015Z

219

강의 후반부에 나온 실습 코드는 어디서 받을 수 있나요?

2025-01-01T08:30:38.103Z

245

cdc 기반의 스트리밍 데이터 처리

2024-12-17T07:13:47.238Z

268

broadcast 코드 예시 관련 질문

2024-12-17T06:18:51.298Z

158

재생에 문제가 생겼어요 라는 메세지가 자꾸 뜨네요

2024-12-13T02:10:28.994Z

137

스트리밍 예제 실행 시 py4j.protocol.Py4JNetworkError 발생

2024-10-07T15:16:42.595Z

248

Repartition과 Coalesce에 대해 궁금한 점이 있어요!

2024-08-15T05:26:31.253Z

180

pyspark 현업에서 로컬 개발 및 운영

2024-05-14T10:17:57.209Z

353

Spark Structured Streaming Gracefully shutdown 질문

2024-05-07T14:26:28.352Z

470

PySpark Runtime Architecture 내용 중 질문이 있습니다!

2024-04-16T12:58:26.496Z

235

docker 설치 이후에 터미널 여는 부분에서 막혔습니다

2024-03-20T05:58:52.085Z

484

app-<timestamp>-<executor_id> 폴더가 spark-events 내부에 생기게 하고 싶습니다.

2024-03-16T13:20:31.589Z

302

pyspark.SparkContext 실행 오류 관련 질문

2024-03-14T17:43:34.479Z

405

스파크 아키텍쳐 관련 문의 드립니다.

2024-01-24T23:40:40.803Z

365

3.0에서 추가된 shuffle_hash, shuffle_replicate_nl hint는 어떤 상황에서 쓰는게 좋을까요?

2024-01-02T04:05:41.481Z

330

데이터 엔지니터의 현 트렌드가 궁금합니다

2023-12-29T14:24:24.779Z

486

스칼라강의도 제작하신다고 하셨는데 계획하고 계실까요??

2023-12-23T03:34:26.572Z

309