- 1、hanlp可以使用python调用吗
- 2、怎么安装python 安装python步骤
- 3、python怎么安装
安装JDK
JPype并没有像IKVM那样实现自己的JVM,而是以pipe方式调用原生JVM。所以我们需要一个JVM,比如:
Oracle JDK
OpenJDK
安装JDK非常简单,分清楚32位和64位即可,必须与OS和Python的位数一致,具体安装过程不再赘述。
唯一需要注意的是,必须设置环境变量JAVA_HOME到JDK的根目录,JDK的安装程序不一定会帮你做这一步。
安装编译工具链
Python的package一般是以源码形式发布的,其中一些C代码必须在用户机器上编译,所以需要安装编译工具链。当然你也可以跳过这步,直接下载binary。
Windows
安装免费的Visual C++ Express 2010。
Debian/Ubuntu
sudo apt-get install g++
Red Hat/Fedora
su -c ‘yum install gcc-c++’
安装JPype
本文读者应该都是Python程序员,所以略过了安装Python这一步。不过必须注意的是,JPype版本与Python的对应兼容关系:
Python2.x:JPype
Python3.x:JPype1-py3
使用setup.py安装
下载源码后解压,在目录下运行:
*nix
sudo python3 setup.py install
Windows
python setup.py install
直接下载binary
当然你也可以选择下载binary,比如JPype1-py3主页上的binary列表。
在Pycharm中安装
如果你正在使用Pycharm这款IDE的话,那么事情就简单多了。
首先在Project Interpreter里面点击加号:
搜索JPype,选择你需要的版本安装:
稍等片刻就安装成功了:
测试安装结果
终于又到了写代码的开心时间了,可以通过如下代码测试是否安装成功:
from jpype import *startJVM(getDefaultJVMPath())java.lang.System.out.println(“hello world”)shutdownJVM()
输出如下结果表示安装成功:
hello worldJVM activity report : classes loaded : 31JVM has been shutdown
调用HanLP
关于HanLP
HanLP是
一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体
识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析
(MaxEnt依存句法分析、神经网络依存句法分析)。
下载HanLP
你可以直接下载Portable版的jar,零配置。
也可以使用自定义的HanLP——HanLP由3部分组成:类库hanlp.jar包、模型data包、配置文件hanlp.properties,请前往项目主页下载最新版:。对于非portable版,下载后,你需要编辑配置文件第一行的root指向data的父目录,详见文档。
这里,假设新建了一个目录(假定为C:\hanlp),把hanlp.jar和hanlp.properties(portable版的话,仅需一个hanlp-portable.jar)放进去:
Python调用
下面是一份Python3的调用示例:
# -*- coding:utf-8 -*-
# Filename: main.py
# Author:hankcs
# Date: 2015/11/26 14:16
from jpype import *
startJVM(getDefaultJVMPath(), “-Djava.class.path=C:\hanlp\hanlp-1.2.8.jar;C:\hanlp”, “-Xms1g”, “-Xmx1g”)
HanLP = JClass(‘com.hankcs.hanlp.HanLP’)
# 中文分词
print(HanLP.segment(‘你好,欢迎在Python中调用HanLP的API’))
testCases = [
“商品和服务”,
“结婚的和尚未结婚的确实在干扰分词啊”,
“买水果然后来世博园最后去世博会”,
“中国的首都是北京”,
“欢迎新老师生前来就餐”,
“工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作”,
“随着页游兴起到现在的页游繁盛,依赖于存档进行逻辑判断的设计减少了,但这块也不能完全忽略掉。”]
for sentence in testCases: print(HanLP.segment(sentence))
# 命名实体识别与词性标注
NLPTokenizer = JClass(‘com.hankcs.hanlp.tokenizer.NLPTokenizer’)
print(NLPTokenizer.segment(‘中国科学院计算技术研究所的宗成庆教授正在教授自然语言处理课程’))
# 关键词提取
document = “水利部水资源司司长陈明忠9月29日在国务院新闻办举行的新闻发布会上透露,” \
“根据刚刚完成了水资源管理制度的考核,有部分省接近了红线的指标,” \
“有部分省超过红线的指标。对一些超过红线的地方,陈明忠表示,对一些取用水项目进行区域的限批,” \
“严格地进行水资源论证和取水许可的批准。”
print(HanLP.extractKeyword(document, 2))
# 自动摘要
print(HanLP.extractSummary(document, 3))
# 依存句法分析
print(HanLP.parseDependency(“徐先生还具体帮助他确定了把画雄鹰、松鼠和麻雀作为主攻目标。”))
shutdownJVM()
1、进入python官网下载页面,鼠标移入【download】会显示下拉导航栏,根据自己的电脑系统选择相应的版本,如果是windows系统,就选windows,如果是苹果就选mac。
2、点击windows进入windows版本列表页面,选择一个版本下载。
3、选择一个路径下载到电脑上。
4、双击弹出安装界面如下图,记得勾选“Add python 3.6 to path”,这样系统安装的时候就自动配置和环境变量,不需要自己去手动配置了。
5、点击“install now”让系统自动安装。
6、安装完成后是这样的,但是我们需要检测一下python是否真的安装成功了;打开命令提示框,输入python,如果显示版本信息就说明安装成功了。
在Python官网下载Python安装包,双击打开Python软件。勾选add Python 3.8 to PATH,点击install Now。安装完成后,点击Close.打开电脑命令提示符,输入Python,按回车键运行。出现版本号,就说明安装成功。
工具/原料:
hp台式机
Windows10 64位
Python 3.8.6安装包
1、在Python官网下载Python安装包,双击打开Python软件。
2、勾选add Python 3.8 to PATH。
3、点击install Now。
4、等待安装完成。
5、安装完成后,点击Close.
6、打开电脑命令提示符,输入Python,按回车键运行。
7、出现版本号,就说明安装成功。
原创文章,作者:简单一点,如若转载,请注明出处:https://www.506064.com/n/126276.html