'카프카' 태그의 글 목록

카프카는 왜 빠를까?

카프카는 왜 빠를까? 카프카는 적은 시간에 많은 데이터를 처리할 수 있도록 최적화되어 있다. 어떤 시스템 디자인 덕분에 카프카가 대량의 데이터를 처리할 수 있는 걸까? 대표적인 2가지 특징을 알아보자. 1) Kafka’s reliance on sequential I/O 디스크의 데이터 접근 방식에는 2가지가 있다. Random Sequential Sequential의 경우 디스크에서 데이터를 읽을 때 바로 옆의 데이터로 순차적으로 읽기 때문에 Random 방식보다 빠르다. 카프카는 append-only log를 통해 Sequential 하게 데이터를 처리한다. 두 접근 방식의 성능을 간략히 비교하면 Random 방식은 100KB/s, Sequential 방식은 100MB/s으로 큰 차이가 난다. 이를 통..

소프트웨어 개발 2024.02.19

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

hyunjuuun.dev

카프카 1

티스토리툴바