本文目錄一覽:
java語言中文分詞程序怎麼編寫分詞程序正
現可以提供兩種思路:
1.String或是StringBuffer(建議用) 中的indexOf(“中華”)方法,查找給定的的字符串中是否有給定詞表中的詞。
2.借鑒編譯原理中的狀態裝換的思想。
先編寫一個狀態機,用於測試給定字符串中的詞是否滿足詞表中的內容。
寫在最後:1)建議使用第一種方法,因為在java 內部實現的查找操作其實 和你想得思路是相同的,不過他的效率會高些。
2)如果個人的編程能力比較強或是不考慮效率只是想實現專有的分詞算法。可以使用第二種方法。
3)以上的兩種方法都可以使用多線程來提高程序的效率。
java語言中文分詞程序怎麼編寫
現可以提供兩種思路:
1.String或是StringBuffer(建議用)
中的indexOf(“中華”)方法,查找給定的的字符串中是否有給定詞表中的詞。
2.借鑒編譯原理中的狀態裝換的思想。
先編寫一個狀態機,用於測試給定字符串中的詞是否滿足詞表中的內容。
寫在最後:1)建議使用第一種方法,因為在java
內部實現的查找操作其實
和你想得思路是相同的,不過他的效率會高些。
2)如果個人的編程能力比較強或是不考慮效率只是想實現專有的分詞算法。可以使用第二種方法。
3)以上的兩種方法都可以使用多線程來提高程序的效率。
如何用接瓦法在java中對文章進行分詞
用Java的StringTokenizer可以直接將字符串按照空格進行分詞。 import java.util.StringTokenizer; public class Test2 { public static void main(String [] args) { String str = “hello java world”; StringTokenizer st = new StringTokenize
java如何分詞??
如果你的分詞規則是在一個字符串的開頭和結尾加上”_”,然後兩個字符一分的話,代碼可以這樣寫:
import java.util.ArrayList;
import java.util.List;
public class Participle
{
private static final String HEAD_END_STR = “_”;
private static final int PARTICIPLE_LENGTH = 2;
public static void main(String[] args)
{
String exampleWord = “計算機”;
exampleWord = “_” + exampleWord + “_”;
int length = exampleWord.length();
ListString result = new ArrayListString();
for (int i = 0; i length – 1; i++)
{
String str = exampleWord.substring(i, i + PARTICIPLE_LENGTH);
result.add(str);
}
System.out.println(result);
}
}
輸出結果:_計, 計算, 算機, 機_
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/243510.html