카프카는 왜 빠를까? 카프카는 적은 시간에 많은 데이터를 처리할 수 있도록 최적화되어 있다. 어떤 시스템 디자인 덕분에 카프카가 대량의 데이터를 처리할 수 있는 걸까? 대표적인 2가지 특징을 알아보자. 1) Kafka’s reliance on sequential I/O 디스크의 데이터 접근 방식에는 2가지가 있다. Random Sequential Sequential의 경우 디스크에서 데이터를 읽을 때 바로 옆의 데이터로 순차적으로 읽기 때문에 Random 방식보다 빠르다. 카프카는 append-only log를 통해 Sequential 하게 데이터를 처리한다. 두 접근 방식의 성능을 간략히 비교하면 Random 방식은 100KB/s, Sequential 방식은 100MB/s으로 큰 차이가 난다. 이를 통..