特性
Kafka 是一種高吞吐量 的分散式發布訂閱訊息系統,有如下特性:
• 通過O(1)的磁碟數據結構提供訊息的持久化,這種結構對於即使數以TB的訊息存儲也能夠保持長時間的穩定性能。
• 高吞吐量 :即使是非常普通的硬體Kafka也可以支持每秒數百萬 的訊息。
• 支持通過Kafka伺服器和消費機集群來分區訊息。
• 支持Hadoop並行數據載入。
Kafka通過官網發布了最新版本2.0.0
相關術語介紹
• Broker
• Kafka集群包含一個或多個伺服器,這種伺服器被稱為broker
• Topic
• 每條發布到Kafka集群的訊息都有一個類別,這個類別被稱為Topic。(物理上不同Topic的訊息分開存儲,邏輯上一個Topic的訊息雖然保存於一個或多個broker上但用戶只需指定訊息的Topic即可生產或消費數據而不必關心數據存於何處)
• Partition
• Partition是物理上的概念,每個Topic包含一個或多個Partition.
• Producer
• 負責發布訊息到Kafka broker
• Consumer
• 訊息消費者,向Kafka broker讀取訊息的客戶端。
• Consumer Group
• 每個Consumer屬於一個特定的Consumer Group(可為每個Consumer指定group name,若不指定group name則屬於默認的group)。