java轉碼,java轉碼方法

本文目錄一覽：

1、java怎樣實現將GB2312編碼的字符串轉換為ISO-8859-1編碼的字符串
2、java文件讀取內容轉碼
3、java如何把string轉為utf-8

java怎樣實現將GB2312編碼的字符串轉換為ISO-8859-1編碼的字符串

通過JDK1.6知道String類中getBytes（”編碼“）方法可以講一個數用指定的編碼轉成一個字節數組，String中通過指定的 charset解碼指定的 byte 數組，構造一個新的 String。代碼如下：

try{

String s = “java學習”;

System.out.println(s);

String result = new String(s.getBytes(“GB2312″),”iso-8859-1”);

System.out.println(s);

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

擴展資料：

getBytes() 方法有兩種形式：

1、getBytes(String charsetName): 使用指定的字符集將字符串編碼為 byte 序列，並將結果存儲到一個新的 byte 數組中。

2、getBytes(): 使用平台的默認字符集將字符串編碼為 byte 序列，並將結果存儲到一個新的 byte 數組中。

參考資料：

百度百科-getBytes()

java文件讀取內容轉碼

讀取的文件流如果是read（讀取字節流的時候，中文就會是亂碼）方法，所以現在全都是聽過readline方式進行的讀取。舉例：

可以通過BufferedReader 流的形式進行流緩存，之後通過readLine方法獲取到緩存的內容。

BufferedReader bre = null;

try {

String file = “D:/test/test.txt”;

bre = new BufferedReader(new FileReader(file));//此時獲取到的bre就是整個文件的緩存流

while ((str = bre.readLine())!= null) // 判斷最後一行不存在，為空結束循環

{

System.out.println(str);//原樣輸出讀到的內容

}；

bre.close()，//關閉流，否則bre流會一直存在，直到程序運行結束。

除此之外，java文件讀取的時候有中文就很出現亂碼，通常獲取到的文件中通常都是“iso8859-1”格式，需要轉換為“UTF-8”格式。

如：String str = new String（str.getByte(“iso8859-1”),”UTF-8″）;進行下強制轉換後在進行讀取即可。

備註：通常格式有GBK、UTf-8、iso8859-1、GB2312，如果上面的強制轉換不成功，依次進行這些格式的嘗試，肯定是可以解決問題的。

java如何把string轉為utf-8

java不同編碼之間進行轉換，都需要使用unicode作為中轉。

String str = “任意字符串”;

str = new String(str.getBytes(“gbk”),”utf-8″);

備註說明：

str.getBytes(“UTF-8”); 意思是以UTF-8的編碼取得字節

new String(XXX,”UTF-8″); 意思是以UTF-8的編碼生成字符串

舉例：

public static String getUTF8XMLString(String xml) {

// A StringBuffer Object

StringBuffer sb = new StringBuffer();

sb.append(xml);

String xmString = “”;

String xmlUTF8=””;

try {

xmString = new String(sb.toString().getBytes(“UTF-8”));

xmlUTF8 = URLEncoder.encode(xmString, “UTF-8”);

System.out.println(“utf-8 編碼：” + xmlUTF8) ;

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

// return to String Formed

return xmlUTF8;

擴展資料:

UTF-8編碼規則：

如果只有一個字節則其最高二進制位為0；如果是多字節，其第一個字節從最高位開始，連續的二進制位值為1的個數決定了其編碼的字節數，其餘各字節均以10開頭。

實際表示ASCII字符的UNICODE字符，將會編碼成1個字節，並且UTF-8表示與ASCII字符表示是一樣的。所有其他的UNICODE字符轉化成UTF-8將需要至少2個字節。每個字節由一個換碼序列開始。第一個字節由唯一的換碼序列，由n位連續的1加一位0組成，首字節連續的1的個數表示字符編碼所需的字節數。

Unicode轉換為UTF-8時，可以將Unicode二進制從低位往高位取出二進制數字，每次取6位，如上述的二進制就可以分別取出為如下示例所示的格式，前面按格式填補，不足8位用0填補。

參考資料來源：百度百科:UTF-8

原創文章，作者：ODWM，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/142615.html

java轉碼,java轉碼方法

本文目錄一覽：

java怎樣實現將GB2312編碼的字符串轉換為ISO-8859-1編碼的字符串

java文件讀取內容轉碼

java如何把string轉為utf-8

相關推薦

發表回復