인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

yhy258's profile image
yhy258

asked

15-day big data pilot project

1. Overview of real-time loading of big data

배치형 대규모 데이터 적재 관련 질문

Written on

·

291

0

안녕하세요, 배치형 데이터 적재 관련해서 질문 드립니다.

배치형 데이터의 경우 Flume이 모니터링 하는 SpoolDir로 데이터가 들어와야 hdfs로 적재가 되는데, 1일 단위로 데이터가 발생하는 현재 상황에서 매일 txt 파일을 spooldir로 직접 mv 해줘야하는 건가요??

감사합니다. 

redis데이터 엔지니어링ZooKeeperImpalaKafkaFlumebigdataHadoop

Answer 1

0

빅디님의 프로필 이미지
빅디
Instructor

안녕하세요! "yhy258"님!

네~ 플럼의 Spooldir 영역으로 이동을 해주는건 맞는데요..

실제 프로덕트 환경에선 사람이 수작업으로 이동 시키지는 않습니다.

약속된 시간에 파일 수집이 완료 되면, 해당 파일을 Spooldir로 이동 시키는 스크립트(or 워크플로우)를 스케즐러가 작동 시키는 자동화 작업을 수행합니다.

이를위해 쉘스크립트를 직접짜서 크론탭에서 관리하거나, 오픈소스 워크플로우로 Airflow or Azkaban 등을 사용합니다.

- 빅디 드림

 

 

yhy258's profile image
yhy258

asked

Ask a question