inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[아파치 카프카 애플리케이션 프로그래밍] 개념부터 컨슈머, 프로듀서, 커넥트, 스트림즈까지!

아파치 카프카가 데이터 파이프라인으로 적합한 4가지 이유

카프카 영속성 관련 질문

279

돈가스날다

작성한 질문수 31

1

안녕하세요. 영속성 관련해 질문 드립니다.
 
- 데이터를 파일 시스템에 저장함으로써 영속성을 얻게 되고
- 한 번 읽은 데이터를 페이지 캐시 메모리 영역에 놔둠으로써 처리량 또한 높게 유지할 수 있다
 
저는 이렇게 이해했는데, 이렇게 했을 때 컨슈머 쪽에서 Read는 빠르겠지만 프로듀서 쪽에서 Write하는 속도는 여전히 느릴 것처럼 느껴지는데 이 문제는 배치로 처리함으로써 해결하는 건가요?
 
혹시 컨슈머 속도 대비 프로듀서의 속도가 느려서 컨슈머 쪽에서 컴퓨팅 리소스 낭비가 생기는 경우는 없나요?
 
보통 프로듀서의 데이터가 브로커에 도착하는 속도와 컨슈머가 브로커의 데이터를 읽어가는 속도 중 어느 쪽이 더 빠른가요?
 
 

카프카 데이터 엔지니어링 Kafka

답변 1

1

데브원영 DVWY

돈가스날다님, 질문주신내용 답변드립니다.

 

1) 컨슈머와 프로듀서의 속도 차이?

컨슈머와 프로듀서는 내부에서 구현하신 로직에 따라서 속도차이가 날 수 있겠으나 기본적으로는 "둘 다 빠르게 처리한다"라고 가정하고 개발하시면 됩니다. 만약 컨슈머의 처리 속도가 느리다면 파티션 개수와 컨슈머 개수를 스케일 아웃하여 대응할 수 있습니다.

2) 컨슈머 속도와 프로듀서의 속도 차이에 의한 컨슈머의 리소스 낭비?

앞서 1에서 말씀드린바와 같이 내부 로직에 의해서 처리량이 차이날 수 있습니다. 물론 프로듀서에서 보내는 데이터의 양이 많을 경우엔 컨슈머가 리소스를 100%사용하지 않는 경우도 있겠으나, 이 경우는 컨슈머 랙이 없는 정상적인 경우이므로 일반적으로 best case라고 볼 수 있습니다.

3) 프로듀서와 컨슈머의 속도 어느 쪽이 더 빠른가요?

내부 로직에 따라 다르므로 구현하시는 방법, 데이터 생성양에 따라 그때 그때 다르다고 볼 수 있습니다.

 

카프카 ISR 개념 부분 질문

0

484

1

카프카 커넥터를 두가지 사용하는 이유

0

903

1

브로커, 토픽, 파티션관계

0

679

1

커넥트(소스), 커넥트(싱크)

1

538

1

카프카 isr 질문 있어요

0

332

1

파티션 질문 있어요

0

390

1

명령어 관련 문의드립니다.

0

427

2

토픽의 레코드가 라운드로빈으로 배정되는 방식 질문있습니다.

0

427

2

레코드에 json 형태의 데이터 넣는법 질문

0

431

2

카프카 도커로 실행

1

442

1

CCDAK 질문입니다!

0

1351

1

스트림즈 조인에 관련해서 질문드립니다.

0

303

1

min.insync.replicas에서 설정값만큼의 브로커 다운시

0

256

1

브로커로 메시지를 보낼때 null값인 경우

0

466

1

zookeeper 실행시 에러

1

784

1

온프레미스 환경 설치에 대해 질문있습니다.

0

352

1

리밸런싱 시, 메시지 중복 처리 문제

0

1065

1

강사님, Idempotence / transaction의 차이가 궁금합니다.

0

372

1

브로커 장애 발생시 질문

0

335

1

에러 핸들링과 관련하여 질문 드립니다

0

313

1

토픽 생성시 파티션이 배치되는 방법

0

356

1

질문있습니다!

0

138

1

카프카 스트림즈 에러 핸들링 질문 드립니다

0

397

1

카프카 클러스터 질문이 있습니다.

0

183

1