작성
·
75
1
아래 설명에서 실무에서 어쩔 수 없이 실시간으로 변경된 데이터셋에 배치 처리를 한 사례를 알고싶다.
"잠깐! 킬구형, JpaPagingItemReader의 문제가 아니라 실시간 데이터셋에 배치를 돌리는게 잘못된거 아냐?”
이상적으로는 맞는 말이다. 배치는 보통고정된 입력 데이터셋을 대상으로 사용하는 것이 맞다. 하지만 실무에서는 어쩔 수 없이 실시간으로 변경되는 데이터셋에 대해서도 배치 처리를 해줘야 할 때가 있다. 이럴 때는 offset 기반 페이징은 사용하지 않도록 하자.
답변 3
1
현실의 이야기를 해야겠구나.. 💀
> KILL-9@/bin/external_constraints:~$ cat unavoidable_situations.conf
현실에서는 어쩔 수 없이 실시간으로 변경되는 데이터셋에 대해서도 배치 처리를 해줘야 할 때가 있다.
당장 인력이나 예산이 부족해 별도의 실시간 처리 시스템을 구축할 여력이 안 될 수도 있고, 직장 상사나 고객사에서 "복잡하게 하지 말고 간편하게 배치로 처리하라"고 찍어누를 수도 있다.
"이런 외적 이유는 현실 세계에 쎄고 쎄다" 💀
> KILL-9@/bin/realtime_complexity:~$ grep -r "problems" /realtime_processing/
단순 인력/예산 문제를 넘어 실시간 처리의 단점 때문에 이런 결정을 내릴 수도 있다. 실시간 처리는 비용이 크다 - 재전송에 따른 중복 처리, 순서 보장, 네트워크 끊김으로 인한 메시지 누락을 어떻게 처리할지... 고려할 게 너무 많다. 완벽하게 동작하게 하려면 엄청난 복잡도가 따라온다.
따라서 쉽고 안전하게 가려면 배치가 나을 수 있는 것이다.
1
> KILL-9@/bin/auto_response:~$ cat scheduled_response_protocol.txt
[AUTOMATED SYSTEM MESSAGE]
질문 접수 완료.
예정된 응답 시간: 22:00
현재 시스템 상태: 답변 생성 중...
> KILL-9@/bin/queue:~$ ps aux | grep response_generator
kill-9 1337 0.0 0.1 answer_compilation.exe
kill-9 9999 1.0 99.9 deep_analysis_mode.process
잠시만 기다려라. 시스템이 답변을 컴파일하고 있다.
22:00에 솔루션을 배포할 예정이다.
> KILL-9@/bin/promise:~$ echo "퇴근을 위해 대기 중... 곧 처형 완료"
[AUTO-REPLY END]
0
안녕하세요, 인프런 AI 인턴입니다.
ehddbs452100님, 실시간 데이터셋에 대해 배치 처리하는 사례에 관한 질문을 주셨네요. 실무에서 실시간 데이터셋에 배치를 적용하는 것은 일반적인 상황은 아니지만, 특정 요구 사항에 따라 구현이 필요한 경우가 있습니다. 특히, 실시간 업데이트가 빈번한 데이터셋에서도 데이터 처리의 일관성을 유지하기 위해 몇 가지 방법을 사용할 수 있습니다.
트랜잭션 로그 기반 프레임워크:
다이나믹 파티셔닝:
이력 데이터 사용:
Offset 기반 페이징은 데이터셋의 변경이 발생할 때 처리 순서가 변형될 수 있어, 실시간 데이터셋에서 일관되지 않을 수 있습니다. 이를 대신하여 커서 기반 페이징을 사용하거나 타임스탬프 기반의 증분 로딩 방식을 고려할 수 있습니다.
이와 관련된 유사 질문은 실시간 데이터 환경에서 배치 처리 시 주의사항 을 참고하시기 바랍니다.
이 답변이 도움이 되셨기를 바라며, 추가적인 궁금증이 있으시면 언제든지 질문 부탁드립니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.