本文目錄一覽:
- 1、用java語言實現詞性標註後的名詞抽取
- 2、Java編程 如何提取單詞表中的詞性
- 3、java中是否有區分詞性的類庫
- 4、Java類庫和包有什麼區別?
- 5、java 中常用五大包有哪些?
- 6、java用什麼分詞器去 標註英文單詞的詞性
用java語言實現詞性標註後的名詞抽取
舉個例子
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 提取漢字
*
* @author ajax_2003
* @version 1.0, 2009-7-23
*
*/
public class ExtractKanji {
public static void main(String[] args) {
String str = “第七/m 章/q 茶樹/n 芽/n 葉/n 咀/n 食性/n 害蟲/n 咀/n 食/n 茶樹/n 芽/n 葉/n 的/u 害蟲/n ,”
+ “/w 主要/d 是/v 蛾/n 類/q 幼蟲/n ,/w 包括/v 尺蠖/n 、/w 毒蛾/n 、/w 卷/q 類/n 、/w 蓑/n 蛾/n 、”
+ “/w 刺/v 蛾/n 、/w 夜蛾/n 等/u 類/n 及/c 茶/n 蠶/n 、/w 茶葉/n 斑/n 蛾/n 等/u 。”
+ “/w 另/r 一/m 類/q 是/v 象甲/n 、/w 葉/n 甲等/b 甲蟲/n ,”
+ “/w 直接/a 蠶食/v 芽/n 梢/n 及/c 成/v 老葉/n 第一/m 節/q 尺蠖蛾/n 類/q 害蟲/n 危害/v 茶樹/n 的/u “
+ “尺蠖/n 多達/v 40/m 余/m 種/q ,/w 同/p 屬/v 鱗翅目/n 尺蠖蛾/n 科/n 。”;
String result = getKanji(str);
System.out.println(result);
}
private static String getKanji(String str) {
Pattern pattern = Pattern.compile(“[^/\\w]+”);
Matcher matcher = pattern.matcher(str);
StringBuilder sb = new StringBuilder();
while (matcher.find()) {
sb.append(matcher.group());
}
return sb.toString();
}
}
Java編程 如何提取單詞表中的詞性
設計一個數據結構,讀取文本數據,保存好。
通過不同輸入參數判斷不同屬性。
java中是否有區分詞性的類庫
這個取決於你要做什麼
一個詞,可以有很多種詞性,具體詞性是根據在句子中的位置決定的。
你到底是要字典,可以查詞性,還是需要語法解析器,來分析在句子中的詞性
Java類庫和包有什麼區別?
通俗一點點講,類是為了解決java中的問題而出現的,你要跟好友通信,就寫一個通信類來解決這個問題,你要處理網頁前台的數據,你就寫個數據處理類,寫好的類就好比數學公式,參數不同,公式固定不變,得出結果不同,你寫好一個通信類,這個類不改變,但你可以跟不同人聊天
包的存在是為了區別相同名字的類出現的,包通俗的講就是電腦上的文件夾,你可以在一個文件夾下創建兩個名字一樣的文本文件么,當然不可以,包也是,包里不允許同名文件,你的手機可以選擇移動的手機卡和電信的手機卡,卡長的都一樣,但它們能在同一個運營商那裡買到么,不能,移動運營商和電信運營商相當於包,電話卡相當於同名文件,不同包存儲不同功能的類
java 中常用五大包有哪些?
常用的五個
java.lang.*
提供利用 Java 編程語言進行程序設計的基礎類。最重要的類是 Object(它是類層次結構的根)和 Class(它的實例表示正在運行的應用程序中的類)。
java.util.*
包含集合框架、遺留的 collection 類、事件模型、日期和時間設施、國際化和各種實用工具類(字符串標記生成器、隨機數生成器和位數組、日期Date類、堆棧Stack類、向量Vector類等)。集合類、時間處理模式、日期時間工具等各類常用工具包
java.io.*
Java的核心庫java.io提供了全面的IO接口。包括:文件讀寫、標準設備輸出等。Java中IO是以流為基礎進行輸入輸出的,所有數據被串行化寫入輸出流,或者從輸入流讀入。
java.net.*
並非所有系統都支持 IPv6 協議,而當 Java 網絡連接堆棧嘗試檢測它並在可用時透明地使用它時,還可以利用系統屬性禁用它。在 IPv6 不可用或被顯式禁用的情況下,Inet6Address 對大多數網絡連接操作都不再是有效參數。雖然可以保證在查找主機名時 java.net.InetAddress.getByName 之類的方法不返回 Inet6Address,但仍然可能通過傳遞字面值來創建此類對象。在此情況下,大多數方法在使用 Inet6Address 調用時都將拋出異常。
java.sql.*
提供使用 JavaTM 編程語言訪問並處理存儲在數據源(通常是一個關係數據庫)中的數據的 API。此 API 包括一個框架,憑藉此框架可以動態地安裝不同驅動程序來訪問不同數據源。
java用什麼分詞器去 標註英文單詞的詞性
可以試試stanford Tagger, 百度搜索下stanford Tagger。
中文詞性標註可以用hanlp.
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/289219.html