inflearn logo
강의

Course

Instructor

Apache Flink with Silicon Valley Engineers

Processing Kafka data in Flink

kafka 단독 실시간 데이터 처리보다 flink를 추가로 구축하고 사용시의 장점에 대해 질문 드립니다.

Resolved

81

back47402311

2 asked

0

안녕하세요, 강의 잘 들었습니다.

아직 실무에 flink를 사용해 본 적이 없어 조금 더 구체적인 장점등을 알고 싶어 질문 드리게 되었습니다.

사실 기존에는 kafka만을 사용해서 실시간 데이터 처리를 하는 사례도 많았던 것 같은데

이 때 추가로 flink를 사용할 때 kafka만을 사용할 때 보다 어떤 부분이 더 나은지 등에 대해 조금 궁금해져서 질문 드립니다.

빅데이터 데이터-엔지니어링 data-analysis flink 데이터-트랜스포메이션

Answer 1

0

altoformula

안녕하세요, 백지훈님,

좋은 질문이에요. 요약하자면...

  • Kafka 단독일 경우에는 메시지 버스 + 간단한 소비/생산에 최적이라 할수 있고, 상태가 작고, 윈도우/조인/지연 이벤트 처리가 단순한 경우 괜찮습니다.

  • Flink 추가하시면 대규모 상태, 이벤트타임 정확성, 복잡한 윈도우 조인, 재처리 및 Backfill, 정확히 한 번 처리까지 더 많은 장점이 있습니다.

제가 실전에서 느꼈던 좋은 점으로는 지연 이벤트 보정, 세션 종료 타이머 같은 것을 잘 쓰고 있습니다.

0

back47402311

아 이해가 됐습니다. 감사합니다. 배운 것들을 토대로 현업에서 잘 활용해 보겠습니다 ㅎㅎ

RandomForest vs lgb

0

8

1

21c 버전으로 해도 무방한가요?

0

3

2

전처리 관련질문

0

7

2

작업형3 기출

0

7

1

유형2에서 데이터분할 생략 가능여부

0

10

1

9회 기출 유형3 질문

0

9

1

lgb 기초편

0

7

1

괄호 사용

0

11

1

수업노트는 어디서 볼 수 있나요?

0

16

2

작업형 2 데이터 전처리 질문

0

11

0

11회 기출 유형 작업형1 문제 3-1

0

9

0

예시문제 작업형2 (ver2023) 질문입니다

0

12

1

Data type에 따른 처리

0

9

1

데이터 전처리 관련

0

14

2

시험에서 문제 불러오기

0

12

2

2번문제 출력값 질문

0

17

2

pd.get_dummies()가 bool로 반환

0

16

2

대응표본검정 레빈

0

20

3

단일표본검정 문제 유형

0

22

2

[작업형 3] 6~7. 카이제곱 검정

0

18

2

9회 작업형3 문제 1-1

0

33

2

Flink 2.0 버전부터 스칼라를 더이상 지원하지 않네요

0

115

2

Data Sink Topology 질문 있습니다

0

62

2

State Management & Fault Tolerance 부분 설명이 하나도 이해가 안 돼요

0

88

2