RabbitMQ VS Kafka

[참고 자료]

영상: [10분 테코톡] RabbitMQ vs Kafka
블로그:

서론

현대 서버 애플리케이션 구조상 메시징 시스템은 필연적이다.

로직을 분리해 응답 속도 향상, 안정성, 실행 보장, 다른 애플리케이션 서버와 통신 등 목적은 다양할 것이다.
그리고, 많은 개발팀들이 어떤 기술을 사용할 지 고민할것이다.

나 또한 "우리 팀은 왜 Kafka 가 아닌 RabbitMQ 를 사용할까?" 라는 궁금증에서 시작했고,
그 과정에서 나름대로의 답을 찾은거 같아서 공유하기 위해 작성했다.

RabbitMQ (Smart Broker & Dumb Consumer)

RabbitMQ는 AMQP(Advanced Message Queuing Protocol) 를 구현한 메시지 브로커이며, MQTT 프로토콜도 제공한다.
중심 아이디어는 브로커(RabbitMQ)가 라우팅, 메시지 보관 및 전달 로직의 대부분을 담당

AMQP?
Advanced Message Queueing Protocol: 메시지 지향 미들웨어를 위한 표준 프로토콜
서로 다른 시스템, 애플리케이션이 메시지를 안정적으로 주고 받게 해주는 규약

상호 운용성: 서로 다른 언어, 플랫폼으로 개발되어도 원활히 통신

안정성, 신뢰성: 메시지를 유실되지 않고 안정적으로 전달되는 것을 보장 - 메시지 확인 (ACK), 메시지 영속성, 트랜잭션

유연한 라우팅: Exchange 를 통해 라우팅 - 생산자는 Exchange 에 보내고, Exchange 가 설정 규칙에 따라 적절한 큐로 메시지 분배

Producer (생산자): 메시지를 생성하여 Exchange로 전송
Exchange (교환기): Producer로부터 받은 메시지를 어떤 Queue로 보낼지 결정하는 라우팅 규칙의 집합 (메시지 자체를 저장 X)
- Direct Exchange: 라우팅 키가 정확히 일치하는 Queue에 메시지 전송 (유니캐스트)
- Topic Exchange: 라우팅 키가 특정 패턴에 일치하는 Queue에 메시지 전송 (멀티캐스트)
- Fanout Exchange: 자신에게 바인딩된 모든 Queue에 메시지를 전송 (브로드캐스트)
- Headers Exchange: 메시지 헤더의 속성을 기반으로 라우팅
Queue (큐): 소비자가 메시지를 가져갈 때까지 메시지를 저장하는 버퍼
Binding (바인딩): Exchange와 Queue를 연결하는 규칙. ("이 Exchange는 라우팅 규칙에 따라 이 Queue로 메시지를 보내라")
Consumer (소비자): Queue에서 메시지를 가져와 처리

핵심 흐름: Producer → Exchange → (Binding Rule) → Queue → Consumer

스마트 브로커

메시지 흐름 완벽 제어: 브로커가 Exchang & Binding 규칙에 따라 메시지 어디로 보낼지 판단 및 라우팅
소비자 상태 추적: 컨슈머가 어떤 큐에 연결되어 있는지, 메시지를 제대로 처리했는지 계속 추적
메시지를 소비자에게 전송: Push, 브로커가 컨슈머에게 메시지를 전달 - 컨슈머는 prefetch 로 자신이 감당할 수 있는 양만 조절
다양한 부가 기능: Dead Letter Exchanges, 메시지 TTL, 우선순위 큐 등등 기능 제공

더미 컨슈머

단순 역할 집중: 컨슈머는 지정된 큐 연결해 브로커가 주는 메시지를 받아 처리하고, 처리 완료 신호만 보냄
라우팅 대해 알 필요 없음: 컨슈머는 메시지가 어떤 과정을 거쳐 자신의 큐에 도착하는지 고려할 필요 없음

=> 우체국(브로커)이 모든 편지를 분류하고 주소를 알려주며, 집배원(소비자)이 자신의 구역에 할당된 편지를 배달하는 시스템

Kafka (Dumb Broker & Smart Consumer)

Kafka는 분산 스트리밍 플랫폼이며, 메시지를 변경 불가능한 로그(immutable log)의 연속된 스트림으로 취급
브로커는 데이터를 저장하고 관리, 복잡한 라우팅 로직은 소비자가 담당

Broker (브로커): Kafka 서버 인스턴스. 메시지를 저장하고 관리하며, 여러 브로커가 모여 Cluster를 구성
- Producer 로부터 메시지 수신, 오프셋 지정해 메시지를 디스크에 저장
- 컨슈머의 파티션 읽기 요청에 응답하고, 디스크에 수록된 메시지 전송
- 한 개는 클러스터의 컨트롤러 역할 수행 - 각 브로커에게 담당 파티션 할당, 브로커 정상 동작하는지 모니터링
Cluster (클러스터): 여러 브로커로 구성되어 데이터 복제, 장애 허용(fault tolerance), 고가용성을 제공
- 클러스터 내 서버 브로커 추가하면, 메시지 수신 및 전달에 대한 처리량 증가
- 시스템 전체 사용에 영향을 주지 않으며, 온라인 상태 수행 가능 ( 소규모 운영 하다가, 트래픽 양에 따라 대규모 늘릴 수 있는 장점 )

Topic (토픽): 메시지를 구분하기 위한 카테고리 또는 피드 이름. RabbitMQ의 Exchange와 유사한 역할이나, 메시지를 직접 저장
- 일종의 DB 테이블, 파일 시스템의 폴더와 유사
- 하나의 토픽은 여러 개의 파티션으로 구성
Partition (파티션): 추가만 가능한(append-only) 로그이며, 이를 통해 Topic의 데이터를 여러 브로커에 분산하여 저장하고 처리량을 높일 수 있습니다.
- 한 파티션 내에서는 메시지의 순서가 보장됩니다. - 여러 파티션 간 순서 보장 X

Producer (생산자): 메시지(레코드)를 생성하여 특정 Topic으로 전송
Consumer (소비자): Topic에서 메시지를 가져와 처리
- 하나 이상의 토픽 구독, 메시지 생성된 순서대로 읽음 - 파티션 단위로 오프셋 유지해 메시지 위지 파악 가능
Offset (오프셋): 파티션 내에서 각 메시지가 갖는 고유한 순번(ID)입니다. 소비자는 오프셋을 통해 어디까지 메시지를 읽었는지 추적하고 제어
- Commit Offset: 컨슈머가 여기까지 오프셋을 처리했다는 것을 확인하는 오프셋
- Current Offset: 컨슈머가 어디까지 메시지를 읽었는지는 것을 확인하는 오프셋
Consumer Group (소비자 그룹): 하나 이상의 소비자를 묶은 그룹. 하나의 Topic에 대해, 각 파티션은 소비자 그룹 내의 단 하나의 소비자에게만 할당
- 각 컨슈머가 해당 토픽의 다른 파티션을 분담해서 메시지 읽을 수 있음
- 컨슈머를 추가하면, 메시지 소비 성능 확장

하나의 토픽 내 파티션 개수보다 더 많은 컨슈머를 추가하는게 의미 없음

핵심 흐름: Producer → Topic (Partition) → Consumer (Consumer Group)

더미 브로커

고성능 파일 저장소 역할에 집중: 브로커는 메시지를 받아서 토픽 파티션 끝에 빠르게 추가, 디스크에 저장
메시지 상태 추적 X: 브로커는 어떤 소비자가 어떤 메시지를 읽었는지 고려 X, 그냥 설정된 보존 기간 동안 저장
복잡한 라우팅 X: 메시지 받으면 생산자가 지정한 토픽 / 파티션에 저장, 브로커가 자체적 메시지 재분배 X

스마트 컨슈머

읽을 위치를 직접 관리: 컨슈머가 자신이 토픽의 어떤 파티션에서 몇 번째 메시지까지 읽었는지 스스로 기록 & 관리
데이터를 직접 당겨옴: Pull, 컨슈머가 브로커에게 능동적으로 요청해서 데이터를 가져옴
파티션 할당 로직 담당: 소비자 그룹 내 어떤 파티션을 담당할지 결정 로직도 소비자가 속한 클라이언트 라이브러리에서 처리

=> 거대한 도서관 (브로커) 은 책 (메시지) 을 책장 (파티션) 에 계속 꽂아두기만 할 뿐
독자 (소비자) 가 직접 도서관 찾아와 자기가 읽을 부분 (오프셋) 을 기억하고, 다음 읽을 책도 꺼내가는 형태

Gemini 비유 좋다...!

흔한 오해들

두 개가 구조가 비슷하고, 성능만 차이 난다고 오해를 할 수 있는데 (또는, RabbitMQ 가 사용하지 않는 메시징 시스템이라던가...)
이 개념들을 명확히 이해해야 두 시스템의 아키텍처 철학 차이를 제대로 파악할 수 있다.

팬아웃: 하나의 메시지를 여러 독립적 소비자가 각각 동일한 복사본 받아 처리하는 패턴

1. Kafka의 '팬아웃'은 단순한 전파(Broadcast)가 아니다

가장 흔한 오해 중 하나는 Kafka는 Pub/Sub, RabbitMQ는 Work-Queue라는 이분법적 시각이다.
사실 Kafka는 이 두 가지 모델을 소비자 그룹(Consumer Group) 이라는 개념을 통해 우아하게 통합해준다고 한다.

그룹 간(Inter-Group)에는 Pub/Sub (팬아웃/방송):
서로 다른 소비자 그룹은 같은 토픽을 구독하더라도 메시지 스트림 전체를 독립적으로 소비한다.
EX) order-events라는 토픽이 있을 때, 재고 관리 서비스(그룹 A)와 데이터 분석 팀(그룹 B) 등 각각 별개의 소비자 그룹으로 구독이 가능하다.
이 경우, 두 그룹 모두 order-events의 모든 메시지를 처음부터 끝까지 받고 개별적으로 처리할 수 있다.
그룹 내(Intra-Group)에서는 Work-Queue (분산 처리):
단, 하나의 같은 소비자 그룹 내에서는 이야기가 달라진다. 그룹에 속한 소비자가 토픽의 파티션(Partition)들을 나누어 처리한다. (하나의 파티션은 그룹 내 단 하나의 소비자에게만 할당)
만약 토픽에 4개의 파티션이 있고, 그룹에 4개의 소비자가 있다면, 각 소비자는 하나의 파티션을 전담하여 메시지를 처리한다.
-> 이는 작업 부하를 분산하고 처리량을 높이는 '워크큐' 모델과 동일하게 처리

핵심: Kafka는 소비자 그룹을 통해 서로 다른 시스템 간에는 데이터를 복제/방송하고, 단일 시스템 내에서는 작업을 분산하여 처리량을 극대화하는 두 가지 방식 모두 적용

2. 메시지 보존(Retention) 철학: '로그'인가, '큐'인가?

두 시스템의 가장 근본적인 차이는 메시지를 다루는 방식이다.

Kafka: 데이터는 '변경 불가능한 로그(Immutable Log)'
Kafka는 소비자가 메시지를 읽어가도 즉시 삭제하지 않는다. 메시지는 설정된 보존 기간(예: 7일) 또는 용량에 도달할 때까지 토픽에 안전하게 보관한다.
소비자는 단지 '어디까지 읽었는지'를 나타내는 오프셋(Offset) 만 관리한다.
- 메시지 재생(Replay) & 시간 여행:
  - 소비자에 버그가 있었다면? 코드를 수정한 뒤, 오프셋을 과거 시점으로 되돌려 모든 데이터를 다시 처리할 수 있다.
  - 메시지를 사용하는 새로운 시스템을 도입했다면? 토픽의 처음부터 모든 이벤트를 가져와 상태를 재구축할 수 있다.
- 다목적 데이터 허브: 하나의 이벤트 스트림을 실시간 대시보드, 배치(Batch) 분석, 모델 학습 등 다양한 목적을 가진 여러 소비자가 각자의 속도에 맞게 여러 번 소비할 수 있다.
RabbitMQ: 데이터는 '처리해야 할 일(Transient Task)'
전통적인 RabbitMQ에서 메시지는 '처리되어야 할 작업'. 소비자가 메시지를 가져가 성공적으로 처리했다고 확인(ack) 신호를 보내면, 메시지는 큐에서 영구적으로 제거된다.

이 방식 특징:
- 작업 큐에 최적화: 이메일을 보내라, 이미지를 생성해라 ,"이미지를 최적화해라" 와 같이 한 번 처리되고 나면 더 이상 필요 없는 작업들을 관리하는 데 매우 효율적이다.
- 오류 처리 중심의 보관: 메시지 TTL(Time-To-Live)이나 Dead Letter Exchange(DLX)는 메시지가 성공적으로 처리되지 못했을 때를 대비한 기능이다.
  (즉, 영구 보존이 아닌 예외 처리 및 재시도 로직을 위한 장치)

참고: RabbitMQ도 시대의 흐름에 맞춰 Streams라는 새로운 큐 타입을 도입. (Kafka처럼 오프셋 기반의 비파괴 소비를 지원하여 로그와 같은 동작을 유사)
하지만 RabbitMQ 는 기본적으로 '소비-제거' 방식의 큐를 위해 사용한다.

3. RabbitMQ의 팬아웃은 '교환기(Exchange)'의 역할

RabbitMQ도 팬아웃의 방식은 Kafka와는 다르다. RabbitMQ의 라우팅 능력의 핵심에는 교환기(Exchange) 를 통해 수행한다.

생산자는 메시지를 큐에 직접 보내는 것이 아니라, 교환기에 보낸다. 그러면 교환기가 설정된 타입과 규칙에 따라 메시지를 어떤 큐에 보낼지 결정한다.

fanout 교환기: 자신에게 연결(binding)된 모든 큐에 메시지를 복사해서 보낸다. 가장 순수한 형태의 방송(Broadcast) 모델
topic 교환기: 라우팅 키와 바인딩 패턴을 와일드카드(*, #)로 매칭, 조건에 맞는 큐에만 메시지를 선택해서 보낸다. (멀티캐스트)
direct 교환기: 라우팅 키가 바인딩 키와 정확히 일치하는 큐에만 메시지를 보냅니다. (유니캐스트)

핵심: RabbitMQ에서는 브로커(교환기)가 '스마트'하게 라우팅 규칙을 해석하여 메시지를 분배
반면 Kafka에서는 생산자가 토픽을 지정하고, 소비자가 '스마트'하게 그룹을 지어 메시지를 가져간다.