kafka的php,kafkal

本文目錄一覽：

1、kafka的原理是什麼？
2、kafka是幹嘛的?
3、Redis、Kafka或RabbitMQ：哪個作為微服務消息代理最合適？
4、thinkphp，kafka，hbase，spark之間的通訊機制怎麼來實現
5、大型的PHP應用，通常使用什麼應用做消息隊列？
6、php 使用kafka

kafka的原理是什麼？

在Kafka中的每一條消息都有一個topic。一般來說在我們應用中產生不同類型的數據，都可以設置不同的主題。一個主題一般會有多個消息的訂閱者，當生產者發布消息到某個主題時，訂閱了這個主題的消費者都可以接收到生產者寫入的新消息。

kafka為每個主題維護了分散式的分區(partition)日誌文件，每個partition在kafka存儲層面是append log。

任何發布到此partition的消息都會被追加到log文件的尾部，在分區中的每條消息都會按照時間順序分配到一個單調遞增的順序編號，也就是我們的offset,offset是一個long型的數字，通過這個offset可以確定一條在該partition下的唯一消息。在partition下面是保證了有序性，但是在topic下面沒有保證有序性。

擴展資料

producer選擇一個topic，生產消息，消息會通過分配策略append到某個partition末尾。

consumer選擇一個topic，通過id指定從哪個位置開始消費消息。消費完成之後保留id，下次可以從這個位置開始繼續消費，也可以從其他任意位置開始消費。

保證了消息不變性，為並發消費提供了線程安全的保證。每個 consumer都保留自己的offset，互相之間不干擾，不存在線程安全問題。

消息訪問的並行高效性。每個topic中的消息被組織成多個partition，partition均勻分配到集群server中。生產、消費消息的時候，會被路由到指定partition，減少競爭，增加了程序的並行能力。

kafka是幹嘛的?

Kafka是由Apache軟體基金會開發的一個開源流處理平台，由Scala和Java編寫。Kafka是一種高吞吐量的分散式發布訂閱消息系統，它可以處理消費者在網站中的所有動作流數據。

這種動作（網頁瀏覽，搜索和其他用戶的行動）是在現代網路上的許多社會功能的一個關鍵因素。這些數據通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。

對於像Hadoop一樣的日誌數據和離線分析系統，但又要求實時處理的限制，這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的消息處理，也是為了通過集群來提供實時的消息。

主要特性

Kafka是一種高吞吐量的分散式發布訂閱消息系統，有如下特性：

通過O(1)的磁碟數據結構提供消息的持久化，這種結構對於即使數以TB的消息存儲也能夠保持長時間的穩定性能。

高吞吐量：即使是非常普通的硬體Kafka也可以支持每秒數百萬的消息。

支持通過Kafka伺服器和消費機集群來分區消息。

支持Hadoop並行數據載入。

Kafka通過官網發布了最新版本3.0.0。

以上內容來自百度百科-kafka

Redis、Kafka或RabbitMQ：哪個作為微服務消息代理最合適？

將非同步通信用於微服務的場合，通常使用消息代理(Message Broker)。消息代理確保不同微服務之間的通信可靠穩定，保證消息在系統內得到管理和監視，並且消息不會被丟失。

開發者可以選擇的一些消息代理有很多，它們的規模和數據功能各不相同。本篇文章將比較三種最受歡迎的消息代理：RabbitMQ，Kafka與Redis。

首先讓我們了解微服務通信。

在微服務之間有常見的兩種通信方式：同步與非同步。

在同步通信中，調用方在發送下一條消息之前等待響應，並且它作為HTTP之上的REST協議運行。相反，在非同步通信中，無需等待響應即可發送消息。這適用於分散式系統，通常需要消息代理來管理消息。

你選擇的通信類型應考慮不同的參數，例如微服務的結構方式，適當的基礎架構，延遲，規模，依賴關係以及通信目的。非同步通信的建立可能會更加複雜，並且需要添加更多組件才能堆疊，但是將非同步通信用於微服務的好處遠大於缺點。

首先根據定義，非同步通信是非阻塞的；第二，它也比同步操作支持更好的縮放；第三，在微服務崩潰的情況下，非同步通信機制提供了各種恢復技術，通常更擅長處理與崩潰有關的錯誤。

另外，當使用代理而不是REST協議時，接收通信的服務實際上並不需要彼此了解。在舊的服務運行了很長時間之後，甚至可以引入新的服務，即能做到更好的解耦服務。

最後，在選擇非同步操作時，您將增強將來創建集中發現，監視，負載平衡甚至策略執行器的能力。這將為您提供在代碼和系統構建中具有靈活性，可伸縮性和更多功能的功能。

非同步通信通常通過消息代理進行管理。也有其他方法，例如aysncio，但它們更加稀少和有限。

在選擇代理執行非同步操作時，應考慮以下幾點：

一對一

一對多

我們檢查了那裡最新和最出色的服務，以找出這三個類別中最強的提供商。

RabbitMQ（AMQP）

規模：根據配置和資源，這裡的運行速度約為每秒50K msg。

持久性：支持持久性消息和瞬時消息。

一對一與一對多的消費者：兩者都有。

RabbitMQ於2007年發布，是最早創建的常見消息代理之一。它是一個開放源代碼，通過實現高級消息隊列協議（AMQP）通過點對點和pub-sub方法傳遞消息。它旨在支持複雜的路由邏輯。

有一些託管服務可讓您將其用作SaaS，但它不是本機主要雲提供商堆棧的一部分。RabbitMQ支持所有主要語言，包括Python，Java，.NET，PHP，Ruby，JavaScript，Go，Swift等。

在持久模式下，可能會遇到一些性能問題。

kafka

規模：每秒最多可以發送一百萬條消息。

持久性：是的。

一對一vs一對多的消費者：只有一對多（乍一看似乎很奇怪，對吧？！）。

Kafka曾在Azure，AWS和Confluent上管理SaaS。他們都是Kafka項目的創建者和主要貢獻者。Kafka支持所有主要語言，包括Python，Java，C C ++，Clojure，.NET，PHP，Ruby，JavaScript，Go，Swift等。

Redis

規模：每秒最多可以發送一百萬條消息。

持久性：基本上不是，它是內存中的數據存儲。

一對一與一對多的消費者：兩者都有。

Redis與其他消息代理有點不同。Redis的核心是一個內存中的數據存儲，可以用作高性能鍵值存儲或消息代理。另一個區別是Redis沒有持久性，而是將其內存轉儲到Disk DB中。它還非常適合實時數據處理。

最初，Redis不是一對一和一對多的。但是，由於Redis 5.0引入了pub-sub，因此功能得到了增強，一對多成為真正的選擇。

我們介紹了RabbitMQ，Kafka和Redis的一些特徵。這三種動物都是它們的類別，但是如上所述，它們的運行方式大不相同。這是我們建議正確的消息代理根據不同用例使用的建議。

短命消息：Redis

Redis的內存資料庫幾乎適用於不需要持久性的消息短暫的用例。因為Redis提供了非常快速的服務和內存功能，所以它是短保留消息的理想選擇，在這些消息中持久性不是很重要，您可以容忍一些丟失。隨著5.0中Redis流的發布，它也成為了一對多用例的候選者，由於局限性和舊的pub-sub功能，絕對需要使用它。

大量數據：Kafka

Kafka是一個高吞吐量的分散式隊列，用於長時間存儲大量數據。對於需要持久性的一對多用例，Kafka是理想的選擇。

複雜路由：RabbitMQ

RabbitMQ是一個較老但很成熟的代理，具有許多支持複雜路由的功能。當所需速率不高（超過數萬msg sec）時，它甚至將支持複雜的路由通信。

考慮您的軟體堆棧

當然，最後要考慮的是你當前的軟體堆棧。如果你正在尋找一個相對簡單的集成過程，並且不想在堆棧中維護其他代理，那麼你可能更傾向於使用已由堆棧支持的代理。

例如，如果你在RabbitMQ之上的系統中使用Celery for Task Queue，那麼您會獲得與RabbitMQ或Redis一起使用的動力，而不是不支持Kafka且需要進行一些重寫的Kafka。

我們通過平台的發展和壯大使用了以上所有內容，然後再進行一些使用！重要的是要記住，每種工具都有自己的優點和缺點，這與了解它們並為工作以及特定的時機，情況和要求選擇合適的工具有關。

thinkphp，kafka，hbase，spark之間的通訊機制怎麼來實現

Spark 有自己的 Kafka connector 用於從Kafka讀出讀入數據。

Spark 到 Hbase 很多人就用一個foreach operator來寫數據。

大型的PHP應用，通常使用什麼應用做消息隊列？

一、消息隊列概述

消息隊列中間件是分散式系統中重要的組件，主要解決應用耦合，非同步消息，流量削鋒等問題。實現高性能，高可用，可伸縮和最終一致性架構。是大型分散式系統不可缺少的中間件。

目前在生產環境，使用較多的消息隊列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。

二、消息隊列應用場景

以下介紹消息隊列在實際應用中常用的使用場景。非同步處理，應用解耦，流量削鋒和消息通訊四個場景。

2.1非同步處理

場景說明：用戶註冊後，需要發註冊郵件和註冊簡訊。傳統的做法有兩種1.串列的方式；2.並行方式。

（1）串列方式：將註冊信息寫入資料庫成功後，發送註冊郵件，再發送註冊簡訊。以上三個任務全部完成後，返回給客戶端。（架構KKQ：466097527，歡迎加入）

（2）並行方式：將註冊信息寫入資料庫成功後，發送註冊郵件的同時，發送註冊簡訊。以上三個任務完成後，返回給客戶端。與串列的差別是，並行的方式可以提高處理的時間。

假設三個業務節點每個使用50毫秒鐘，不考慮網路等其他開銷，則串列方式的時間是150毫秒，並行的時間可能是100毫秒。

因為CPU在單位時間內處理的請求數是一定的，假設CPU1秒內吞吐量是100次。則串列方式1秒內CPU可處理的請求量是7次（1000/150）。並行方式處理的請求量是10次（1000/100）。

小結：如以上案例描述，傳統的方式系統的性能（並發量，吞吐量，響應時間）會有瓶頸。如何解決這個問題呢？

引入消息隊列，將不是必須的業務邏輯，非同步處理。改造後的架構如下：

按照以上約定，用戶的響應時間相當於是註冊信息寫入資料庫的時間，也就是50毫秒。註冊郵件，發送簡訊寫入消息隊列後，直接返回，因此寫入消息隊列的速度很快，基本可以忽略，因此用戶的響應時間可能是50毫秒。因此架構改變後，系統的吞吐量提高到每秒20 QPS。比串列提高了3倍，比並行提高了兩倍。

2.2應用解耦

場景說明：用戶下單後，訂單系統需要通知庫存系統。傳統的做法是，訂單系統調用庫存系統的介面。如下圖：

傳統模式的缺點：

1）假如庫存系統無法訪問，則訂單減庫存將失敗，從而導致訂單失敗；

2）訂單系統與庫存系統耦合；

如何解決以上問題呢？引入應用消息隊列後的方案，如下圖：

訂單系統：用戶下單後，訂單系統完成持久化處理，將消息寫入消息隊列，返回用戶訂單下單成功。

庫存系統：訂閱下單的消息，採用拉/推的方式，獲取下單信息，庫存系統根據下單信息，進行庫存操作。

假如：在下單時庫存系統不能正常使用。也不影響正常下單，因為下單後，訂單系統寫入消息隊列就不再關心其他的後續操作了。實現訂單系統與庫存系統的應用解耦。

2.3流量削鋒

流量削鋒也是消息隊列中的常用場景，一般在秒殺或團搶活動中使用廣泛。

應用場景：秒殺活動，一般會因為流量過大，導致流量暴增，應用掛掉。為解決這個問題，一般需要在應用前端加入消息隊列。

可以控制活動的人數；

可以緩解短時間內高流量壓垮應用；

用戶的請求，伺服器接收後，首先寫入消息隊列。假如消息隊列長度超過最大數量，則直接拋棄用戶請求或跳轉到錯誤頁面；

秒殺業務根據消息隊列中的請求信息，再做後續處理。

2.4日誌處理

日誌處理是指將消息隊列用在日誌處理中，比如Kafka的應用，解決大量日誌傳輸的問題。架構簡化如下：

日誌採集客戶端，負責日誌數據採集，定時寫受寫入Kafka隊列；

Kafka消息隊列，負責日誌數據的接收，存儲和轉發；

日誌處理應用：訂閱並消費kafka隊列中的日誌數據；

以下是新浪kafka日誌處理應用案例：

(1)Kafka：接收用戶日誌的消息隊列。

(2)Logstash：做日誌解析，統一成JSON輸出給Elasticsearch。

(3)Elasticsearch：實時日誌分析服務的核心技術，一個schemaless，實時的數據存儲服務，通過index組織數據，兼具強大的搜索和統計功能。

(4)Kibana：基於Elasticsearch的數據可視化組件，超強的數據可視化能力是眾多公司選擇ELK stack的重要原因。

2.5消息通訊

消息通訊是指，消息隊列一般都內置了高效的通信機制，因此也可以用在純的消息通訊。比如實現點對點消息隊列，或者聊天室等。

點對點通訊：

客戶端A和客戶端B使用同一隊列，進行消息通訊。

聊天室通訊：

客戶端A，客戶端B，客戶端N訂閱同一主題，進行消息發布和接收。實現類似聊天室效果。

以上實際是消息隊列的兩種消息模式，點對點或發布訂閱模式。模型為示意圖，供參考。

三、消息中間件示例

3.1電商系統

消息隊列採用高可用，可持久化的消息中間件。比如Active MQ，Rabbit MQ，Rocket Mq。（1）應用將主幹邏輯處理完成後，寫入消息隊列。消息發送是否成功可以開啟消息的確認模式。（消息隊列返回消息接收成功狀態後，應用再返回，這樣保障消息的完整性）

（2）擴展流程（發簡訊，配送處理）訂閱隊列消息。採用推或拉的方式獲取消息並處理。

（3）消息將應用解耦的同時，帶來了數據一致性問題，可以採用最終一致性方式解決。比如主數據寫入資料庫，擴展應用根據消息隊列，並結合資料庫方式實現基於消息隊列的後續處理。

3.2日誌收集系統

分為Zookeeper註冊中心，日誌收集客戶端，Kafka集群和Storm集群（OtherApp）四部分組成。

Zookeeper註冊中心，提出負載均衡和地址查找服務；

日誌收集客戶端，用於採集應用系統的日誌，並將數據推送到kafka隊列；

四、JMS消息服務

講消息隊列就不得不提JMS 。JMS（Java Message Service,Java消息服務）API是一個消息服務的標準/規範，允許應用程序組件基於JavaEE平台創建、發送、接收和讀取消息。它使分散式通信耦合度更低，消息服務更加可靠以及非同步性。

在EJB架構中，有消息bean可以無縫的與JM消息服務集成。在J2EE架構模式中，有消息服務者模式，用於實現消息與應用直接的解耦。

4.1消息模型

在JMS標準中，有兩種消息模型P2P（Point to Point）,Publish/Subscribe(Pub/Sub)。

4.1.1 P2P模式

P2P模式包含三個角色：消息隊列（Queue），發送者(Sender)，接收者(Receiver)。每個消息都被發送到一個特定的隊列，接收者從隊列中獲取消息。隊列保留著消息，直到他們被消費或超時。

P2P的特點

每個消息只有一個消費者（Consumer）(即一旦被消費，消息就不再在消息隊列中)

發送者和接收者之間在時間上沒有依賴性，也就是說當發送者發送了消息之後，不管接收者有沒有正在運行，它不會影響到消息被發送到隊列

接收者在成功接收消息之後需向隊列應答成功

如果希望發送的每個消息都會被成功處理的話，那麼需要P2P模式。（架構KKQ：466097527，歡迎加入）

4.1.2 Pub/sub模式

包含三個角色主題（Topic），發布者（Publisher），訂閱者（Subscriber）。多個發布者將消息發送到Topic,系統將這些消息傳遞給多個訂閱者。

Pub/Sub的特點

每個消息可以有多個消費者

發布者和訂閱者之間有時間上的依賴性。針對某個主題（Topic）的訂閱者，它必須創建一個訂閱者之後，才能消費發布者的消息。

為了消費消息，訂閱者必須保持運行的狀態。

為了緩和這樣嚴格的時間相關性，JMS允許訂閱者創建一個可持久化的訂閱。這樣，即使訂閱者沒有被激活（運行），它也能接收到發布者的消息。

如果希望發送的消息可以不被做任何處理、或者只被一個消息者處理、或者可以被多個消費者處理的話，那麼可以採用Pub/Sub模型。

4.2消息消費

在JMS中，消息的產生和消費都是非同步的。對於消費來說，JMS的消息者可以通過兩種方式來消費消息。

（1）同步

訂閱者或接收者通過receive方法來接收消息，receive方法在接收到消息之前（或超時之前）將一直阻塞；

（2）非同步

訂閱者或接收者可以註冊為一個消息監聽器。當消息到達之後，系統自動調用監聽器的onMessage方法。

JNDI：Java命名和目錄介面,是一種標準的Java命名系統介面。可以在網路上查找和訪問服務。通過指定一個資源名稱，該名稱對應於資料庫或命名服務中的一個記錄，同時返回資源連接建立所必須的信息。

JNDI在JMS中起到查找和訪問發送目標或消息來源的作用。（架構KKQ：466097527，歡迎加入）

4.3JMS編程模型

(1) ConnectionFactory

創建Connection對象的工廠，針對兩種不同的jms消息模型，分別有QueueConnectionFactory和TopicConnectionFactory兩種。可以通過JNDI來查找ConnectionFactory對象。

(2) Destination

Destination的意思是消息生產者的消息發送目標或者說消息消費者的消息來源。對於消息生產者來說，它的Destination是某個隊列（Queue）或某個主題（Topic）;對於消息消費者來說，它的Destination也是某個隊列或主題（即消息來源）。

所以，Destination實際上就是兩種類型的對象：Queue、Topic可以通過JNDI來查找Destination。

(3) Connection

Connection表示在客戶端和JMS系統之間建立的鏈接（對TCP/IP socket的包裝）。Connection可以產生一個或多個Session。跟ConnectionFactory一樣，Connection也有兩種類型：QueueConnection和TopicConnection。

(4) Session

Session是操作消息的介面。可以通過session創建生產者、消費者、消息等。Session提供了事務的功能。當需要使用session發送/接收多個消息時，可以將這些發送/接收動作放到一個事務中。同樣，也分QueueSession和TopicSession。

(5) 消息的生產者

消息生產者由Session創建，並用於將消息發送到Destination。同樣，消息生產者分兩種類型：QueueSender和TopicPublisher。可以調用消息生產者的方法（send或publish方法）發送消息。

(6) 消息消費者

消息消費者由Session創建，用於接收被發送到Destination的消息。兩種類型：QueueReceiver和TopicSubscriber。可分別通過session的createReceiver(Queue)或createSubscriber(Topic)來創建。當然，也可以session的creatDurableSubscriber方法來創建持久化的訂閱者。

(7) MessageListener

消息監聽器。如果註冊了消息監聽器，一旦消息到達，將自動調用監聽器的onMessage方法。EJB中的MDB（Message-Driven Bean）就是一種MessageListener。

深入學習JMS對掌握JAVA架構，EJB架構有很好的幫助，消息中間件也是大型分散式系統必須的組件。本次分享主要做全局性介紹，具體的深入需要大家學習，實踐，總結，領會。

五、常用消息隊列

一般商用的容器，比如WebLogic，JBoss，都支持JMS標準，開發上很方便。但免費的比如Tomcat，Jetty等則需要使用第三方的消息中間件。本部分內容介紹常用的消息中間件（Active MQ,Rabbit MQ，Zero MQ,Kafka）以及他們的特點。

5.1 ActiveMQ

ActiveMQ 是Apache出品，最流行的，能力強勁的開源消息匯流排。ActiveMQ 是一個完全支持JMS1.1和J2EE 1.4規範的 JMS Provider實現，儘管JMS規範出台已經是很久的事情了，但是JMS在當今的J2EE應用中間仍然扮演著特殊的地位。

ActiveMQ特性如下：

⒈ 多種語言和協議編寫客戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協議： OpenWire,Stomp REST,WS Notification,XMPP,AMQP

⒉ 完全支持JMS1.1和J2EE 1.4規範（持久化，XA消息，事務)

⒊ 對spring的支持，ActiveMQ可以很容易內嵌到使用Spring的系統裡面去，而且也支持Spring2.0的特性

⒋ 通過了常見J2EE伺服器（如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試，其中通過JCA 1.5 resource adaptors的配置，可以讓ActiveMQ可以自動的部署到任何兼容J2EE 1.4 商業伺服器上

⒌ 支持多種傳送協議：in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA

⒍ 支持通過JDBC和journal提供高速的消息持久化

⒎ 從設計上保證了高性能的集群，客戶端-伺服器，點對點

⒏ 支持Ajax

⒐ 支持與Axis的整合

⒑ 可以很容易得調用內嵌JMS provider，進行測試

5.2 RabbitMQ

RabbitMQ是流行的開源消息隊列系統，用erlang語言開發。RabbitMQ是AMQP（高級消息隊列協議）的標準實現。支持多種客戶端，如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等，支持AJAX，持久化。用於在分散式系統中存儲轉發消息，在易用性、擴展性、高可用性等方面表現不俗。

幾個重要概念：

Broker：簡單來說就是消息隊列伺服器實體。

Exchange：消息交換機，它指定消息按什麼規則，路由到哪個隊列。

Queue：消息隊列載體，每個消息都會被投入到一個或多個隊列。

Binding：綁定，它的作用就是把exchange和queue按照路由規則綁定起來。

Routing Key：路由關鍵字，exchange根據這個關鍵字進行消息投遞。

vhost：虛擬主機，一個broker里可以開設多個vhost，用作不同用戶的許可權分離。

producer：消息生產者，就是投遞消息的程序。

consumer：消息消費者，就是接受消息的程序。

channel：消息通道，在客戶端的每個連接里，可建立多個channel，每個channel代表一個會話任務。

消息隊列的使用過程，如下：

（1）客戶端連接到消息隊列伺服器，打開一個channel。

（2）客戶端聲明一個exchange，並設置相關屬性。

（3）客戶端聲明一個queue，並設置相關屬性。

（4）客戶端使用routing key，在exchange和queue之間建立好綁定關係。

（5）客戶端投遞消息到exchange。

exchange接收到消息後，就根據消息的key和已經設置的binding，進行消息路由，將消息投遞到一個或多個隊列里。

5.3 ZeroMQ

號稱史上最快的消息隊列，它實際類似於Socket的一系列介面，他跟Socket的區別是：普通的socket是端到端的（1:1的關係），而ZMQ卻是可以N：M 的關係，人們對BSD套接字的了解較多的是點對點的連接，點對點連接需要顯式地建立連接、銷毀連接、選擇協議（TCP/UDP）和處理錯誤等，而ZMQ屏蔽了這些細節，讓你的網路編程更為簡單。ZMQ用於node與node間的通信，node可以是主機或者是進程。

引用官方的說法：「ZMQ(以下ZeroMQ簡稱ZMQ)是一個簡單好用的傳輸層，像框架一樣的一個socket library，他使得Socket編程更加簡單、簡潔和性能更高。是一個消息處理隊列庫，可在多個線程、內核和主機盒之間彈性伸縮。ZMQ的明確目標是「成為標準網路協議棧的一部分，之後進入Linux內核」。現在還未看到它們的成功。但是，它無疑是極具前景的、並且是人們更加需要的「傳統」BSD套接字之上的一層封裝。ZMQ讓編寫高性能網路應用程序極為簡單和有趣。」

特點是：

高性能，非持久化；

跨平台：支持Linux、Windows、OS X等。

多語言支持； C、C++、Java、.NET、Python等30多種開發語言。

可單獨部署或集成到應用中使用；

可作為Socket通信庫使用。

與RabbitMQ相比，ZMQ並不像是一個傳統意義上的消息隊列伺服器，事實上，它也根本不是一個伺服器，更像一個底層的網路通訊庫，在Socket API之上做了一層封裝，將網路通訊、進程通訊和線程通訊抽象為統一的API介面。支持「Request-Reply 「，」Publisher-Subscriber「，」Parallel Pipeline」三種基本模型和擴展模型。

ZeroMQ高性能設計要點：

1、無鎖的隊列模型

對於跨線程間的交互（用戶端和session）之間的數據交換通道pipe，採用無鎖的隊列演算法CAS；在pipe兩端註冊有非同步事件，在讀或者寫消息到pipe的時，會自動觸發讀寫事件。

2、批量處理的演算法

對於傳統的消息處理，每個消息在發送和接收的時候，都需要系統的調用，這樣對於大量的消息，系統的開銷比較大，zeroMQ對於批量的消息，進行了適應性的優化，可以批量的接收和發送消息。

3、多核下的線程綁定，無須CPU切換

區別於傳統的多線程併發模式，信號量或者臨界區， zeroMQ充分利用多核的優勢，每個核綁定運行一個工作者線程，避免多線程之間的CPU切換開銷。

5.4 Kafka

Kafka是一種高吞吐量的分散式發布訂閱消息系統，它可以處理消費者規模的網站中的所有動作流數據。這種動作（網頁瀏覽，搜索和其他用戶的行動）是在現代網路上的許多社會功能的一個關鍵因素。這些數據通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。對於像Hadoop的一樣的日誌數據和離線分析系統，但又要求實時處理的限制，這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的消息處理，也是為了通過集群機來提供實時的消費。

Kafka是一種高吞吐量的分散式發布訂閱消息系統，有如下特性：

通過O(1)的磁碟數據結構提供消息的持久化，這種結構對於即使數以TB的消息存儲也能夠保持長時間的穩定性能。（文件追加的方式寫入數據，過期的數據定期刪除）

高吞吐量：即使是非常普通的硬體Kafka也可以支持每秒數百萬的消息。

支持通過Kafka伺服器和消費機集群來分區消息。

支持Hadoop並行數據載入。

Kafka相關概念

Broker

Kafka集群包含一個或多個伺服器，這種伺服器被稱為broker[5]

Topic

每條發布到Kafka集群的消息都有一個類別，這個類別被稱為Topic。（物理上不同Topic的消息分開存儲，邏輯上一個Topic的消息雖然保存於一個或多個broker上但用戶只需指定消息的Topic即可生產或消費數據而不必關心數據存於何處）

Partition

Parition是物理上的概念，每個Topic包含一個或多個Partition.

Producer

負責發布消息到Kafka broker

Consumer

消息消費者，向Kafka broker讀取消息的客戶端。

Consumer Group

每個Consumer屬於一個特定的Consumer Group（可為每個Consumer指定group name，若不指定group name則屬於默認的group）。

一般應用在大數據日誌處理或對實時性（少量延遲），可靠性（少量丟數據）要求稍低的場景使用。

php 使用kafka

終端開啟一個消費者：

生產者端發送：

消費者端接收：

起航吧， kafka 之旅

原創文章，作者：PIY39，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/128163.html