關於javasolr的信息

本文目錄一覽:

什麼是solr

SOLR 搜辣 是一款 Apache軟件基金會開發的企業搜索服務器軟件。

Solr是用Java編寫、運行在Servlet容器(如Apache Tomcat或Jetty)的一個獨立的全文搜索服務器。Solr 強大的外部配置功能使得無需進行Java編碼,便可對其進行調整以適應多種類型的應用程序。Solr有一個插件架構,以支持更多的高級定製。

java web 怎麼用solr

我們下載的Solr包後,進入Solr所在的目錄,我們可以看到以下幾個目錄:build、client、dist、example、lib、site、src。下面分別對其進行介紹。

1) build:該目錄是在ant build過程中生成的,其中包含了未被打包成jar或是war的class文件以及一些文檔文件。

2) client:該目錄包含了特定語言的Solr客戶端API,使得使用其他語言的用戶能通過HTTP用XML與Solr進行通話。現在該目錄裏面雖然包含javascript、python、ruby三個子目錄,但是到目前為止只包含一部分的ruby的代碼,其他語言仍是空的。另外,Solr的Java客戶端稱為SolrJ,其代碼位於src/solrj目錄下面。在之後的文章中我會詳細介紹Solr客戶端的使用。

3) dist:該目錄包含build過程中產生的war和jar文件,以及相關的依賴文件。還記得上一篇文章中,我們在build 1.4版本的Solr源代碼後需要部署example嗎?其實就是將該目錄下面的apache-solr-1.4.war部署到Jetty上面去,並重命名為solr.war。

4) example:這個目錄實際上是Jetty的安裝目錄。其中包含了一些樣例數據和一些Solr的配置。

其中一些子目錄也比較重要,這裡也對它們稍作介紹。

l example/etc:該目錄包含了Jetty的配置,在這裡我們可以將Jetty的默認端口從8983改為80端口。

l 將其中的8983端口換成80端口。注意更改端口後啟動Jetty可能會提示你沒有權限,你需要使用sudo java -jar start.jar來運行。

l example/multicore:該目錄包含了在Solr的multicore中設置的多個home目錄。在之後的文章中我會對其進行介紹。

l example/solr:該目錄是一個包含了默認配置信息的Solr的home目錄。

詳見下面的「solr home說明」

l example/webapps:Jetty的webapps目錄,該目錄通常用來放置Java的Web應用程序。在Solr中,前面提到的solr.war文件就部署在這裡。

5) lib:該目錄包含了所有Solr的API所依賴的庫文件。其中包括Lucene,Apache commons utilities和用來處理XML的Stax庫。

6) site:該目錄僅僅包含了Solr的官網的網頁內容,以及一些教程的PDF文檔。

7) src:該目錄包含了Solr項目的整個源代碼。這裡對其各個子目錄也做相應的介紹。

l src/java:該目錄存放的是Solr使用Java編寫的源代碼。

l src/scripts:該目錄存放的是配置Solr服務器的Unix BashShell腳本,在後面介紹多服務器配置中將會有重要的作用。

l src/solrj:前面提到過該目錄存放的是Solr的Java版本的客戶端代碼。

l src/test:該目錄存放的是測試程序的源代碼和測試文件。

l src/webapp:該目錄存放的是管理Solr的Web頁面,包括Servlet和JSP文件,其構成了前面提到的WAR文件。管理Solr的JSP頁面在web/admin目錄下面,如果你有興趣折騰Solr可以找到相應的JSP的頁面對其進行設置

1.4.2 Solr home說明

所謂的Solr home目錄實際上是一個運行的Solr實例所對應的配置和數據(Lucene索引)。在上一篇文章中我提到過在Solr的example/solr目錄就是一個Solr用做示例的默認配置home目錄。實際上example/multicore也是一個合法的Solr home目錄,只不過是用來做mult-core設置的。那麼我們來看看example/solr這個目錄裏面都有些什麼。

example/solr目錄下主要有以下一些目錄和文件:

1) bin:如果你需要對Solr進行更高級的配置,該目錄建議用來存放Solr的複製腳本。

2) conf :該目錄下面包含了各種配置文件,下面列出了兩個最為重要的配置文件。其餘的.txt和.xml文件被這兩個文件所引用,如用來對文本進行特殊的處理。

l conf/schema.xml:該文件是索引的schema,包含了域類型的定義以及相關聯的analyzer鏈。

l conf/solrconfig.xml:該文件是Solr的主配置文件。

l conf/xslt:該目錄包含了各種XSLT文件,能將Solr的查詢響應轉換成不同的格式,如:Atom/RSS等。

3) data:包含了Lucene的二進制索引文件。

4) lib:該目錄是可選的。用來放置附加的Java JAR文件,Solr在啟動時會自動加載該目錄下的JAR文件。這就使得用戶可以對Solr的發佈版本(solr.war)進行擴展。如果你的擴展並不對Solr本身進行修改,那麼就可以將你的修改部署到JAR文件中放到這裡。

Solr是如何找到運行所需要的home目錄的呢?

Solr首先檢查名為solr.solr.home的Java系統屬性,有幾種不同的方式來設置該Java系統屬性。一種不管你使用什麼樣的Java應用服務器或Servlet引擎都通用的方法是在調用Java的命令行中進行設置。所以,你可以在啟動Jetty的時候顯式地指定Solr的home目錄java -Dsolr.solr.home=solr/ -jar start.jar。另一種通用的方法是使用JNDI,將home目錄綁定到java:comp/env/solr/home。並向src/webapp/web/WEB-INF/web.xml添加以下一段代碼:

1 env-entry

2 env-entry-namesolr/home/env-entry-name

3 env-entry-valuesolr//env-entry-value

4 env-entry-typejava.lang.String/env-entry-type

5 /env-entry

實際上這段XML在web.xml文件中已經存在,你只需要把原來注釋掉的xml取消注釋,添加你所要指向的home目錄即可。因為修改了web.xml文件,所以你需要運行antdist-war來重新打包之後再部署WAR文件。

最後,如果Solr的home目錄既沒有通過Java系統屬性指定也沒有通過JNDI指定,那麼他將默認指向solr/。

在產品環境中,我們必須設置Solr的home目錄而不是讓其默認指向solr/。而且應該使用絕對路徑,而不是相對路徑,因為你有可能從不同的目錄下面啟動應用服務器。

註:Jetty 是一個開源的servlet容器,它為基於Java的web內容,例如JSP和servlet提供運行環境。Jetty是使用Java語言編寫的,它的API以一組JAR包的形式發佈。開發人員可以將Jetty容器實例化成一個對象,可以迅速為一些獨立運行(stand-alone)的Java應用提供網絡和web連接。

我們先從使用者的角度出發,最先看到的當然是servlet,因為Solr本身是個獨立的網絡應用程序,需要在Servlet容器中運行來提供服務,所以servlet是用戶接觸的最外層。我們看看org.apache.solr.servlet包。這個包很簡單,只有兩個類:SolrServlet和SolrUpdateServlet.我們很容易從類名中猜出這兩個類的用途。

SolrServlet類繼承HttpServlet類,只有四個方法:

· init()

· destroy()

· doGet()

· doPost()

SolrServlet類中除了普通的Java類對象(包括Servlet相關的)外,有四個Solr本身的類,還有一個Solr本身的異常。其中兩個類和一個異常屬於org.apache.solr.core包,兩個類屬於org.apache.solr.request包。屬於core包的有:

· Config:

· SolrCore:

屬於request包的有:

· SolrQueryResponse:

· QueryResponseWriter:

分析一下這個SolrServlet類。首先servlet會調用init()方法進行初始化:通過Context查找java:comp/env/solr/home來確定Solr的主目錄(home),接着調用Config.setInstanceDir(home)方法設置這個實例的目錄。然後通過SolrCore.getSolrCore()來獲得一個SolrCore實例。destroy()方法將會在Servlet對象銷毀時調用,僅僅調用core.close()關閉SolrCore實例。

當用戶請求進來時doPost()簡單地將任務交給doGet()完成,主要的任務由doGet()完成。分析一下doGet()方法:

1) 使用SolrCore和doGet()參數request生成一個SolrServletRequest對象(注意:這個SolrServletRequest類不是公開類,位於org.apache.solr.servlet包中,繼承了SolrQueryRequestBase類,僅僅接受SolrCore和HttpServletRequest對象作為參數)

2) 然後SolrCore執行execute()方法(參數為SolrServletRequest和SolrQueryResponse)

由此可見,真正的處理核心是SolrCore的execute方法

java怎麼調用solr查詢接口

solr官方網站

下面是一個例子:

import org.apache.solr.client.solrj.SolrServer;

import org.apache.solr.client.solrj.SolrServerException;

import org.apache.solr.client.solrj.impl.CommonsHttpSolrServer;

import org.apache.solr.client.solrj.response.QueryResponse;

import org.apache.solr.common.SolrDocument;

import org.apache.solr.common.params.ModifiableSolrParams;

import java.net.MalformedURLException;

public class Main {

public static void main(String[] args) throws MalformedURLException, SolrServerException {

SolrServer server = new CommonsHttpSolrServer(“”);

ModifiableSolrParams params = new ModifiableSolrParams();

// 查詢關鍵詞

params.set(“q”, “2010”);

// 分頁,,start=0就是從0開始,,rows=5當前返回5條記錄,,,第二頁就是變化start這個值為5就可以了。

params.set(“start”, 0);

params.set(“rows”, 5);

// 排序,,如果按照id 排序,,那麼將score desc 改成 id desc(or asc)

params.set(“sort”, “score desc”);

// 返回信息 * 為全部 這裡是全部加上score,如果不加下面就不能使用score

params.set(“fl”, “*,score”);

QueryResponse response = server.query(params);

// 搜索得到的結果數

System.out.println(“Find:”+ response.getResults().getNumFound()+”\n\n”);

// 輸出結果

for(SolrDocument doc:response.getResults())

{

System.out.println(“id: ” + doc.getFieldValue(“id”).toString());

System.out.println(“title: ” + doc.getFieldValue(“title”).toString()+”\n”);

}

}

}

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/181832.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-11-23 06:43
下一篇 2024-11-23 06:43

相關推薦

  • Java 監控接口返回信息報錯信息怎麼處理

    本文將從多個方面對 Java 監控接口返回信息報錯信息的處理方法進行詳細的闡述,其中包括如何捕獲異常、如何使用日誌輸出錯誤信息、以及如何通過異常處理機制解決報錯問題等等。以下是詳細…

    編程 2025-04-29
  • 使用Python爬蟲獲取電影信息的實現方法

    本文將介紹如何使用Python編寫爬蟲程序,來獲取和處理電影數據。需要了解基本的Python編程語言知識,並使用BeautifulSoup庫和Requests庫進行爬取。 一、準備…

    編程 2025-04-28
  • Python爬取網頁信息

    本文將從多個方面對Python爬取網頁信息做詳細的闡述。 一、爬蟲介紹 爬蟲是一種自動化程序,可以模擬人對網頁進行訪問獲取信息的行為。通過編寫代碼,我們可以指定要獲取的信息,將其從…

    編程 2025-04-28
  • 如何使用Python執行Shell命令並獲取執行過程信息

    本文將介紹如何使用Python執行Shell命令並獲取執行過程信息。我們將從以下幾個方面進行闡述: 一、執行Shell命令 Python內置的subprocess模塊可以方便地執行…

    編程 2025-04-28
  • Python實現身份信息模擬生成與查驗

    本文將從以下幾個方面對Python實現身份信息模擬生成與查驗進行詳細闡述: 一、身份信息生成 身份信息生成是指通過代碼生成符合身份信息規範的虛假數據。Python中,我們可以使用f…

    編程 2025-04-27
  • Dapper使用getschema獲取表信息

    本文旨在介紹Dapper中使用getschema獲取表信息的方法和注意事項。 一、獲取某張表的所有列信息 使用Dapper獲取某張表信息,可以使用 `IDbConnection.G…

    編程 2025-04-27
  • 通過提交信息搜索-使用git

    本篇文章重點講解如何使用git通過提交信息來搜索。我們將從多個方面介紹如何使用git來搜索提交信息,並提供相應的代碼示例以供參考。 一、搜索方式 Git提供了三種搜索方式,分別為:…

    編程 2025-04-27
  • 已裝備我軍的空中信息化作戰平台

    本文將會從多個方面詳細闡述已裝備我軍的空中信息化作戰平台。 一、平台概述 已裝備我軍的空中信息化作戰平台是一個全新的作戰系統,具備實時數據採集、處理、分析、共享的能力。它可以在不同…

    編程 2025-04-27
  • Linux查看系統信息

    一、CPU信息 Linux系統下,查看CPU的信息最常用的命令是lscpu。該命令可以顯示CPU架構、核心數量、線程數、緩存大小、CPU頻率等信息。例如: lscpu 該命令會輸出…

    編程 2025-04-24
  • 軟考 信息安全工程師

    軟考 信息安全工程師是一項技能型國家級資格認證考試,主要測試考生在信息安全領域的理論知識和實踐技能,是證明個人信息安全能力的重要證書。本文將從多個方面對軟考 信息安全工程師做詳細的…

    編程 2025-04-23

發表回復

登錄後才能評論