작성한 질문수
실리콘밸리 리더가 알려주는 빅데이터 처리 (Spark)
(2025.07.22) Databricks Community Edition 중단으로 인한 실습 환경 변경
작성
·
14
1
CSV, PARQUET, DELTA 파일 성능 비교하고 DELTA의 Time Travel 사용하기
Pandas vs. Spark 100M & 1B 레코드 처리 성능 비교하기
Shuffling JOIN과 Broadcast JOIN 학습하기
이 3가지 실습과정 영상을 올ㄹㅕ주시면 좋겠습니다. 예제를 통한 판다스와 스파크 성능 비교부터 실습을 어떻게 진행해야할지 막막하네요.
답변 1
0
맞습니다. 이걸 빨리 올려야 하는데 마침 또 한국에 출장을 왔네요. 주말에 시간내서 하나씩이라도 올려보겠습니다.