- 1、hanlp可以使用python調用嗎
- 2、怎麼安裝python 安裝python步驟
- 3、python怎麼安裝
安裝JDK
JPype並沒有像IKVM那樣實現自己的JVM,而是以pipe方式調用原生JVM。所以我們需要一個JVM,比如:
Oracle JDK
OpenJDK
安裝JDK非常簡單,分清楚32位和64位即可,必須與OS和Python的位數一致,具體安裝過程不再贅述。
唯一需要注意的是,必須設置環境變數JAVA_HOME到JDK的根目錄,JDK的安裝程序不一定會幫你做這一步。
安裝編譯工具鏈
Python的package一般是以源碼形式發布的,其中一些C代碼必須在用戶機器上編譯,所以需要安裝編譯工具鏈。當然你也可以跳過這步,直接下載binary。
Windows
安裝免費的Visual C++ Express 2010。
Debian/Ubuntu
sudo apt-get install g++
Red Hat/Fedora
su -c ‘yum install gcc-c++’
安裝JPype
本文讀者應該都是Python程序員,所以略過了安裝Python這一步。不過必須注意的是,JPype版本與Python的對應兼容關係:
Python2.x:JPype
Python3.x:JPype1-py3
使用setup.py安裝
下載源碼後解壓,在目錄下運行:
*nix
sudo python3 setup.py install
Windows
python setup.py install
直接下載binary
當然你也可以選擇下載binary,比如JPype1-py3主頁上的binary列表。
在Pycharm中安裝
如果你正在使用Pycharm這款IDE的話,那麼事情就簡單多了。
首先在Project Interpreter裡面點擊加號:
搜索JPype,選擇你需要的版本安裝:
稍等片刻就安裝成功了:
測試安裝結果
終於又到了寫代碼的開心時間了,可以通過如下代碼測試是否安裝成功:
from jpype import *startJVM(getDefaultJVMPath())java.lang.System.out.println(“hello world”)shutdownJVM()
輸出如下結果表示安裝成功:
hello worldJVM activity report : classes loaded : 31JVM has been shutdown
調用HanLP
關於HanLP
HanLP是
一個致力於向生產環境普及NLP技術的開源Java工具包,支持中文分詞(N-最短路分詞、CRF分詞、索引分詞、用戶自定義詞典、詞性標註),命名實體
識別(中國人名、音譯人名、日本人名、地名、實體機構名識別),關鍵詞提取,自動摘要,短語提取,拼音轉換,簡繁轉換,文本推薦,依存句法分析
(MaxEnt依存句法分析、神經網路依存句法分析)。
下載HanLP
你可以直接下載Portable版的jar,零配置。
也可以使用自定義的HanLP——HanLP由3部分組成:類庫hanlp.jar包、模型data包、配置文件hanlp.properties,請前往項目主頁下載最新版:。對於非portable版,下載後,你需要編輯配置文件第一行的root指向data的父目錄,詳見文檔。
這裡,假設新建了一個目錄(假定為C:\hanlp),把hanlp.jar和hanlp.properties(portable版的話,僅需一個hanlp-portable.jar)放進去:
Python調用
下面是一份Python3的調用示例:
# -*- coding:utf-8 -*-
# Filename: main.py
# Author:hankcs
# Date: 2015/11/26 14:16
from jpype import *
startJVM(getDefaultJVMPath(), “-Djava.class.path=C:\hanlp\hanlp-1.2.8.jar;C:\hanlp”, “-Xms1g”, “-Xmx1g”)
HanLP = JClass(‘com.hankcs.hanlp.HanLP’)
# 中文分詞
print(HanLP.segment(‘你好,歡迎在Python中調用HanLP的API’))
testCases = [
“商品和服務”,
“結婚的和尚未結婚的確實在干擾分詞啊”,
“買水果然後來世博園最後去世博會”,
“中國的首都是北京”,
“歡迎新老師生前來就餐”,
“工信處女幹事每月經過下屬科室都要親口交代24口交換機等技術性器件的安裝工作”,
“隨著頁遊興起到現在的頁游繁盛,依賴於存檔進行邏輯判斷的設計減少了,但這塊也不能完全忽略掉。”]
for sentence in testCases: print(HanLP.segment(sentence))
# 命名實體識別與詞性標註
NLPTokenizer = JClass(‘com.hankcs.hanlp.tokenizer.NLPTokenizer’)
print(NLPTokenizer.segment(‘中國科學院計算技術研究所的宗成慶教授正在教授自然語言處理課程’))
# 關鍵詞提取
document = “水利部水資源司司長陳明忠9月29日在國務院新聞辦舉行的新聞發布會上透露,” \
“根據剛剛完成了水資源管理制度的考核,有部分省接近了紅線的指標,” \
“有部分省超過紅線的指標。對一些超過紅線的地方,陳明忠表示,對一些取用水項目進行區域的限批,” \
“嚴格地進行水資源論證和取水許可的批准。”
print(HanLP.extractKeyword(document, 2))
# 自動摘要
print(HanLP.extractSummary(document, 3))
# 依存句法分析
print(HanLP.parseDependency(“徐先生還具體幫助他確定了把畫雄鷹、松鼠和麻雀作為主攻目標。”))
shutdownJVM()
1、進入python官網下載頁面,滑鼠移入【download】會顯示下拉導航欄,根據自己的電腦系統選擇相應的版本,如果是windows系統,就選windows,如果是蘋果就選mac。
2、點擊windows進入windows版本列表頁面,選擇一個版本下載。
3、選擇一個路徑下載到電腦上。
4、雙擊彈出安裝界面如下圖,記得勾選「Add python 3.6 to path」,這樣系統安裝的時候就自動配置和環境變數,不需要自己去手動配置了。
5、點擊「install now」讓系統自動安裝。
6、安裝完成後是這樣的,但是我們需要檢測一下python是否真的安裝成功了;打開命令提示框,輸入python,如果顯示版本信息就說明安裝成功了。
在Python官網下載Python安裝包,雙擊打開Python軟體。勾選add Python 3.8 to PATH,點擊install Now。安裝完成後,點擊Close.打開電腦命令提示符,輸入Python,按回車鍵運行。出現版本號,就說明安裝成功。
工具/原料:
hp台式機
Windows10 64位
Python 3.8.6安裝包
1、在Python官網下載Python安裝包,雙擊打開Python軟體。
2、勾選add Python 3.8 to PATH。
3、點擊install Now。
4、等待安裝完成。
5、安裝完成後,點擊Close.
6、打開電腦命令提示符,輸入Python,按回車鍵運行。
7、出現版本號,就說明安裝成功。
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/126276.html