elasticsearch搜索詳解

一、elasticsearch搜索精準度排序

elasticsearch是一個具有強大搜索能力的搜索引擎,涉及到搜索精準度排序,通常需要先設置mapping,即定義index的欄位類型、分詞器等信息。然後,可以通過給相關欄位加boost的方式,提高搜索結果相關度。

PUT /my-index
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "boost": 2
      },
      "content": {
        "type": "text"
      }
    }
  }
}

在上述代碼中,對於title欄位使用了boost=2的方式,表示搜索結果中帶有匹配title關鍵詞的文檔權重將加倍。

二、elasticsearch集群

elasticsearch可以支持多個節點組成一個集群,增強數據可靠性和高可用性。

可以通過下面的方式創建一個集群:

PUT /my-index
{
    "settings": {
        "number_of_shards": 3,
        "number_of_replicas": 2
    }
}

上述代碼中,number_of_shards表示該index被分成3個shards,而number_of_replicas=2表示每個shard對應的副本數是2個。

三、elasticsearch搜索引擎

elasticsearch作為一個搜索引擎,它的搜索能力來自於幾個方面:

1)全文搜索。elasticsearch內置了一組強大的分詞器,能夠智能地處理中文、英文等多種語言的分詞需求;

2)過濾器和聚合器。在搜索過程中,可以針對不同的條件設置各種過濾器和聚合器,比如日期範圍、產品價格區間等;

3)搜索建議。elasticsearch內置了多種搜索建議演算法,可以根據用戶已經輸入的部分關鍵詞,給出相關的搜索建議。

四、elasticsearch搜索指定分詞

在elasticsearch中,可以通過指定分詞器的方式,控制搜索過程中使用的分詞方式。

例如,在下面的代碼中,使用了ik_max_word分詞器來處理content欄位的分詞需求:

PUT /my-index
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "ik_max_word"
      },
      "content": {
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

五、elasticsearch搜索商品

在電商場景中,通常需要使用elasticsearch來搜索商品。下面是一個例子,使用了match查詢來實現搜索商品的功能:

GET /_search
{
  "query": {
    "match": {
      "title": "MacBook"
    }
  }
}

上述代碼中,匹配了title欄位中包含MacBook關鍵詞的商品。

六、elasticsearch搜索原理

elasticsearch搜索原理可以簡單概括為:先根據用戶輸入的關鍵詞構建Query DSL查詢語句,然後在文檔(Document)中進行搜索,找出與查詢語句匹配的文檔並返回。

搜索過程中通常包括以下幾個步驟:

1)分詞。elasticsearch內置了一組強大的分詞器,能夠智能地處理中文、英文等多種語言的分詞需求;

2)查詢解析。elasticsearch將查詢語句解析成內部的Lucene查詢語法;

3)搜索。elasticsearch會在所有的shard上執行查詢,將結果合併之後返回給用戶。在搜索過程中,elasticsearch會使用演算法計算每個文檔的得分,然後按照得分從高到低排序。

七、elasticsearch搜索方式

elasticsearch支持多種搜索方式,包括match查詢、wildcard查詢、range查詢等。

下面是一個wildcard查詢的例子:

GET /_search
{
  "query": {
    "wildcard": {
      "title": "*book*"
    }
  }
}

上述代碼中,匹配了title欄位中包含book關鍵詞的商品。

八、elasticsearch搜索過程

在搜索過程中,elasticsearch通常需要先執行分詞、查詢解析和搜索幾個步驟。

以下是一個簡單的搜索過程例子:

POST /my-index/_search
{
    "query": {
        "match":{
            "title": "MacBook"
        }
    }
}

在上述代碼中,先查詢匹配title欄位中包含MacBook的文檔,然後返回搜索結果。

九、elasticsearch搜索語法

elasticsearch支持多種查詢語法,包括Query DSL、URI Search等。

以下是一個URI Search的例子:

GET /my-index/_search?q=title:MacBook

上述代碼中,使用了title關鍵詞進行搜索。

十、elasticsearch搜索優化

在實際使用elasticsearch進行搜索時,需要考慮一些搜索優化技巧。

例如,可以通過使用bool查詢來組合多種查詢,提高搜索結果相關度:

GET /_search
{
    "query":{
        "bool":{
            "must":[{
                "match":{
                    "title":"最新款 MacBook Air"
                }
            }],
            "should":[{
                "match":{
                    "description":"輕薄便攜,適合出差"
                }
            }],
            "must_not":[{
                "match":{
                    "color":"黃色"
                }
            }]
        }
    }
}

上述代碼中,同時對title欄位和description欄位進行了查詢,提高了搜索結果相關度。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/245408.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 13:09
下一篇 2024-12-12 13:09

相關推薦

  • Elasticsearch API使用用法介紹-get /_cat/allocation

    Elasticsearch是一個分散式的開源搜索和分析引擎,支持全文檢索和數據分析,並且可伸縮到上百個節點,處理PB級結構化或非結構化數據。get /_cat/allocation…

    編程 2025-04-28
  • Elasticsearch Scroll Java的使用指南

    本文旨在詳細介紹如何使用Elasticsearch Scroll Java。Elasticsearch Scroll Java是一種高效的遍歷大型數據集的方法。通過它,我們可以逐個…

    編程 2025-04-27
  • 神經網路代碼詳解

    神經網路作為一種人工智慧技術,被廣泛應用於語音識別、圖像識別、自然語言處理等領域。而神經網路的模型編寫,離不開代碼。本文將從多個方面詳細闡述神經網路模型編寫的代碼技術。 一、神經網…

    編程 2025-04-25
  • Linux sync詳解

    一、sync概述 sync是Linux中一個非常重要的命令,它可以將文件系統緩存中的內容,強制寫入磁碟中。在執行sync之前,所有的文件系統更新將不會立即寫入磁碟,而是先緩存在內存…

    編程 2025-04-25
  • Python輸入輸出詳解

    一、文件讀寫 Python中文件的讀寫操作是必不可少的基本技能之一。讀寫文件分別使用open()函數中的’r’和’w’參數,讀取文件…

    編程 2025-04-25
  • MPU6050工作原理詳解

    一、什麼是MPU6050 MPU6050是一種六軸慣性感測器,能夠同時測量加速度和角速度。它由三個感測器組成:一個三軸加速度計和一個三軸陀螺儀。這個組合提供了非常精細的姿態解算,其…

    編程 2025-04-25
  • nginx與apache應用開發詳解

    一、概述 nginx和apache都是常見的web伺服器。nginx是一個高性能的反向代理web伺服器,將負載均衡和緩存集成在了一起,可以動靜分離。apache是一個可擴展的web…

    編程 2025-04-25
  • git config user.name的詳解

    一、為什麼要使用git config user.name? git是一個非常流行的分散式版本控制系統,很多程序員都會用到它。在使用git commit提交代碼時,需要記錄commi…

    編程 2025-04-25
  • Linux修改文件名命令詳解

    在Linux系統中,修改文件名是一個很常見的操作。Linux提供了多種方式來修改文件名,這篇文章將介紹Linux修改文件名的詳細操作。 一、mv命令 mv命令是Linux下的常用命…

    編程 2025-04-25
  • 詳解eclipse設置

    一、安裝與基礎設置 1、下載eclipse並進行安裝。 2、打開eclipse,選擇對應的工作空間路徑。 File -> Switch Workspace -> [選擇…

    編程 2025-04-25

發表回復

登錄後才能評論