app-<timestamp>-<executor_id> 폴더가 spark-events 내부에 생기게 하고 싶습니다.
275
작성한 질문수 1
안녕하세요? 강의 자료로 주신 docker-compose 파일을 바탕으로 실습을 하고 있습니다.
프로그램을 실행할 때 마다 app-<timestamp>-<executor_id> 형식의 폴더가 docker-compose.yml가 위치한 곳과 같은 곳에 생기는데, 저는 spark-events 내부에만 저장하고 싶은데 어떤 설정을 해야 하는지 잘 모르겠습니다...
spark-defaults.conf
spark.eventLog.enabled true
spark.eventLog.dir file:/tmp/spark-events
spark.history.fs.logDirectory file:/tmp/spark-events
강의 자료에 나온 docker-compose.yml 중 spark의 volumes와 enviroment 부분
volumes:
- .:/opt/bitnami/spark/work
- ./spark_conf/log4j2.properties:/opt/bitnami/spark/conf/log4j2.properties
- ./spark_conf/spark-defaults.conf:/opt/bitnami/spark/conf/spark-defaults.conf
- ./spark-events:/tmp/spark-events
environment:
- SPARK_MODE=master
- SPARK_RPC_AUTHENTICATION_ENABLED=no
- SPARK_RPC_ENCRYPTION_ENABLED=no
- SPARK_LOCAL_STORAGE_ENCRYPTION_ENABLED=no
- SPARK_SSL_ENABLED=no
- SPARK_USER=spark
spark 프로그램 실행시 app 폴더가 생기는 사진
답변 1
0
안녕하세요 성범강님,
아마도 working directory를 말씀하시는 것 같은데, 이는 spark event 디렉토리와 다릅니다. 제가 Notebook으로 현재 강의 들으시는 파일을 실행했는데 이 디렉토리는 안 만들어지는데, 혹시 다른 영상을 보시면서 이 문제를 해결 하시고 싶은 건가요? 아마도 뒤쪽에 Kafka 강의를 들으시면 이러한 폴더가 생기게 되는데 이는 Spark Worker에서 만든 working directory configuration 때문입니다.
이 디렉토리의 위치를 바꾸시고 싶다면, spark-worker container에서 volumnes 로컬 위치를 바꾸어 주시면 됩니다.
아래와 같이 ./working-dir라고 앞부분을 바꿔주시면 현재 디렉토리 working-dir 디렉토리가 생기면서 거기에 저장될 겁니다.
./spark-events 디렉토리는 event를 위한 디렉토리라 같은 곳에 넣는 것을 추천하지는 않습니다.
databricks에 cluster 메뉴가 없습니다.
0
43
2
주피터 사용 및 도커 설치
0
90
2
S3 폴더 구조에 따른 Static Partition Pruning, DPP 질문
0
76
2
broadcast Join과 boradcast + UDF 차이
0
62
2
append 모드 사용 시 집계
0
63
2
CDC 기반 스파크 아키텍처 구현 방법이 궁금합니다.
0
107
2
BroadCast 지원 가능 메모리 문의
0
88
2
rdd, dataframe, spark sql 각각 언제 사용할까요?
0
185
2
강의 후반부에 나온 실습 코드는 어디서 받을 수 있나요?
0
195
3
cdc 기반의 스트리밍 데이터 처리
1
230
2
broadcast 코드 예시 관련 질문
0
126
2
재생에 문제가 생겼어요 라는 메세지가 자꾸 뜨네요
0
113
1
스트리밍 예제 실행 시 py4j.protocol.Py4JNetworkError 발생
0
213
2
Repartition과 Coalesce에 대해 궁금한 점이 있어요!
1
165
1
pyspark 현업에서 로컬 개발 및 운영
1
335
1
Spark Structured Streaming Gracefully shutdown 질문
1
443
2
PySpark Runtime Architecture 내용 중 질문이 있습니다!
1
212
1
docker 설치 이후에 터미널 여는 부분에서 막혔습니다
1
458
2
pyspark.SparkContext 실행 오류 관련 질문
2
378
1
스파크 아키텍쳐 관련 문의 드립니다.
1
351
2
3.0에서 추가된 shuffle_hash, shuffle_replicate_nl hint는 어떤 상황에서 쓰는게 좋을까요?
1
316
1
데이터 엔지니터의 현 트렌드가 궁금합니다
1
469
1
스칼라강의도 제작하신다고 하셨는데 계획하고 계실까요??
1
290
2
pyspark / spark 차이점 질문드립니다.
1
1156
1





