강의

멘토링

커뮤니티

Inflearn Community Q&A

back47402311's profile image
back47402311

asked

Apache Flink with Silicon Valley Engineers

Processing Kafka Data in Flink

kafka 단독 실시간 데이터 처리보다 flink를 추가로 구축하고 사용시의 장점에 대해 질문 드립니다.

Resolved

Written on

·

59

0

안녕하세요, 강의 잘 들었습니다.

아직 실무에 flink를 사용해 본 적이 없어 조금 더 구체적인 장점등을 알고 싶어 질문 드리게 되었습니다.

사실 기존에는 kafka만을 사용해서 실시간 데이터 처리를 하는 사례도 많았던 것 같은데

이 때 추가로 flink를 사용할 때 kafka만을 사용할 때 보다 어떤 부분이 더 나은지 등에 대해 조금 궁금해져서 질문 드립니다.

빅데이터데이터-엔지니어링data-analysisflink데이터-트랜스포메이션

Answer 1

0

altoformula님의 프로필 이미지
altoformula
Instructor

안녕하세요, 백지훈님,

좋은 질문이에요. 요약하자면...

  • Kafka 단독일 경우에는 메시지 버스 + 간단한 소비/생산에 최적이라 할수 있고, 상태가 작고, 윈도우/조인/지연 이벤트 처리가 단순한 경우 괜찮습니다.

  • Flink 추가하시면 대규모 상태, 이벤트타임 정확성, 복잡한 윈도우 조인, 재처리 및 Backfill, 정확히 한 번 처리까지 더 많은 장점이 있습니다.

제가 실전에서 느꼈던 좋은 점으로는 지연 이벤트 보정, 세션 종료 타이머 같은 것을 잘 쓰고 있습니다.

back47402311님의 프로필 이미지
back47402311
Questioner

아 이해가 됐습니다. 감사합니다. 배운 것들을 토대로 현업에서 잘 활용해 보겠습니다 ㅎㅎ

back47402311's profile image
back47402311

asked

Ask a question