查看ES集群狀態

ES（Elasticsearch）是一個基於Lucene搜索引擎的分布式開源搜索和分析引擎。ES集群狀態是指集群的健康狀況、節點狀態、分片狀態等。在運維過程中，了解ES集群狀態是必不可少的。本文將從以下幾個方面對ES集群狀態進行詳細闡述。

一、使用集群健康API查看ES集群健康狀態

ES提供了健康API（_cluster/health），通過該API可以快速了解ES集群的健康狀態。在請求該API時，可以指定wait_for_status參數，期望ES集群達到的健康狀態，常見的健康狀態有：green、yellow、red。其中，green表示所有主分片和副本分片均正常可用，yellow表示所有主分片可用，但有一些副本分片還未分配或者正在恢復中，red表示一些主分片不可用。

GET /_cluster/health

健康API返回的JSON結果中，包含以下信息：

– cluster_name:集群名稱
– status:健康狀態，可能的值為green、yellow和red
– active_shards_percent_as_number:當前可用的分片百分比
– timed_out:請求本身是否超時
– number_of_nodes:集群節點數量
– number_of_data_nodes:數據節點數量
– active_primary_shards:當前活躍的主分片數量
– active_shards:當前活躍的分片數量
– relocating_shards:正在遷移的分片數量
– initializing_shards:正在初始化的分片數量
– unassigned_shards:未分配的分片數量

二、使用節點狀態API查看ES節點狀態

ES提供了節點狀態API（_cat/nodes）獲取節點狀態信息。該API返回多列信息，包括節點IP地址、節點角色、磁盤使用情況、load average、線程池信息、JVM信息等。通過該API可以快速了解每個節點的健康狀態、負載情況、磁盤使用情況等信息。

GET /_cat/nodes?v

節點狀態API返回的輸出列如下：

– ip:節點的IP地址或者主機名
– heap.percent：jvm heap使用百分比
– ram.percent:操作系統內存使用百分比
– load_1m:過去一分鐘的平均負載
– load_5m:過去五分鐘的平均負載
– load_15m:過去十五分鐘的平均負載
– node.role:節點角色，可能的值包括master、data和ingest等
– master:是否是主節點
– name:節點名稱
– disk.total:磁盤總容量
– disk.used:已用磁盤空間
– disk.avail:磁盤可用空間
– disk.used_percent:磁盤使用百分比

三、使用集群狀態API查看ES集群狀態

ES提供了集群狀態API（_cluster/state），可用於查詢ES集群狀態信息，包括節點信息、分片信息、索引信息、節點設置信息等。該API返回的信息量比較大，一般不直接查看，需要通過工具對其進行解析和展示。常用的工具包括Kibana、Grafana、Logstash等。

GET /_cluster/state

集群狀態API返回的JSON結果包含以下信息：

– cluster_uuid：集群UUID，用於標識集群
– state_uuid：當前狀態的UUID，用於標識狀態的版本號，狀態更新時會變化
– master_node：當前主節點節點ID
– nodes：節點信息
– blocks：集群阻塞狀態
– metadata：索引元數據信息
– routing_table：分片路由信息
– routing_nodes：分片節點信息
– indices：索引信息
– snapshots：快照信息

四、使用_Stats API查看ES節點統計信息

ES提供了_Stats API（_nodes/stats）查詢節點統計信息，包括節點cpu、內存、磁盤、網絡、線程池等信息。該API返回的結果較為詳細，一般用於深入了解節點狀態和統計信息。

GET /_nodes/stats?human&pretty

_Stats API返回的JSON結果包含以下信息：

– nodes：包含節點統計信息的Map，以節點ID為key，節點信息為value
– timestamp：本次統計時間戳
– name：節點名稱
– transport_address：節點地址
– jvm：JVM信息
– uptime_in_millis：JVM運行時間
– mem：JVM垃圾回收信息
– threads：JVM線程池信息
– os：操作系統信息
– mem：操作系統內存信息
– cpu：操作系統CPU信息
– load_average：操作系統負載信息
– process：進程信息
– open_file_descriptors：打開文件描述符數量
– cpu：進程CPU信息
– mem：進程內存信息
– fs：文件系統信息，包括磁盤使用情況、分區信息等
– network：網絡信息
– tcp：tcp連接信息
– http：http連接信息
– thread_pool：線程池信息
– name：線程池名稱
– threads：線程數
– queue：線程隊列信息
– transport：傳輸層信息
– rx_count：傳輸層接收的請求數量
– rx_size_in_bytes：傳輸層接收的數據量
– tx_count：傳輸層發送的請求數量
– tx_size_in_bytes：傳輸層發送的數據量

五、使用_Kibana查看ES集群狀態

Kibana是一個基於ES的數據分析和可視化平台，提供了豐富的圖表和儀錶盤組件，用於展示各種數據統計信息。通過Kibana，可以方便地了解ES集群的健康狀態、節點狀態、分片狀態、索引狀態等信息。

首先，在Kibana的首頁，選擇“Management”-“Elasticsearch”-“Index Management”菜單，查看ES集群中所有索引及其狀態。

然後，在Kibana首頁，選擇“Stack Management”-“Monitoring”菜單，查看ES集群狀態信息。通過監控面板，可以實時了解集群狀態、節點狀態、分片狀態、索引狀態等信息。

結語

本文從多個角度詳細闡述了如何查看ES集群狀態，包括使用集群健康API、節點狀態API、集群狀態API、節點統計API和Kibana等方式。在實際的運維工作中，需要綜合使用這些方法，全面了解ES集群的健康狀態、節點狀態、分片狀態、索引狀態等信息，及時發現和解決問題，確保ES集群的穩定運行。

原創文章，作者：XGQDC，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/369223.html