Java Charset詳解

一、什麼是Charset

Charset,顧名思義,即字符集。在Java中,Charset則是對一組編碼方案的封裝。編碼方案則包括了肉眼看到的字符和計算機底層存儲的二進制數之間的關聯關係。Charset類可以用於在字節和字符之間進行轉換,同時它還規定了每種編碼方案中可允許的字符集合。

二、Charset常用API

在Charset中,最常用的API包括了以下幾種:

1. Charset.availableCharsets():獲取所有可用編碼方案的Charset集合。

Map charsets = Charset.availableCharsets();
for (Map.Entry entry : charsets.entrySet()) {
    System.out.println(entry.getKey() + " - " + entry.getValue());
}

2. Charset.forName():獲取指定的Charset。

Charset charset = Charset.forName("UTF-8");

3. Charset.decode():將字節序列解碼為字符序列。

Charset charset = Charset.forName("UTF-8");
ByteBuffer inputBuffer = ByteBuffer.wrap(new byte[] { (byte)0xE4, (byte)0xBD, (byte)0xA0, (byte)0xE5, (byte)0xA5, (byte)0xBD });
CharBuffer charBuffer = charset.decode(inputBuffer);
System.out.println(charBuffer.toString()); // 輸出:“你好”

4. Charset.encode():將字符序列編碼為字節序列。

Charset charset = Charset.forName("UTF-8");
CharBuffer charBuffer = CharBuffer.wrap("你好");
ByteBuffer outputBuffer = charset.encode(charBuffer);
while (outputBuffer.hasRemaining()) {
    System.out.printf("%02X ", outputBuffer.get());
}
// 輸出:E4 BD A0 E5 A5 BD 

三、Charset使用規範

在Charset的使用中,一定要注意編碼方案的正確性,否則會產生亂碼問題。

比如在文件讀寫中,我們常常遇到“編碼不一致”的情況。那麼,如何確保編碼的正確性呢?一種常用的方法是使用InputStreamReader和OutputStreamWriter進行包裝,這兩個類可以將底層的字節流轉換成字符流,同時自動進行編碼和解碼。

舉個例子,在讀取文件時,我們可以這樣操作:

FileInputStream fis = new FileInputStream("file.txt");
InputStreamReader isr = new InputStreamReader(fis, "UTF-8");
BufferedReader br = new BufferedReader(isr);
String line = null;
while ((line = br.readLine()) != null) {
    System.out.println(line);
}
br.close();
isr.close();
fis.close();

而在寫入文件時,則可以這樣操作:

FileOutputStream fos = new FileOutputStream("file.txt");
OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8");
BufferedWriter bw = new BufferedWriter(osw);
bw.write("你好");
bw.newLine();
bw.close();
osw.close();
fos.close();

四、常用編碼方案

在實際開發中,UTF-8和GBK是最常用的兩種編碼方案。其中,UTF-8是一種變長的編碼方案,它可以用1~4個字節表示不同的字符,因此支持全球範圍內的所有語言。而GBK則是一種固定長度的編碼方案,它只能表示中文和少數其他語言的字符。

代碼示例:

Charset utf8 = Charset.forName("UTF-8");
Charset gbk = Charset.forName("GBK");
String s = "你好,世界!";
byte[] utf8Bytes = s.getBytes(utf8);
byte[] gbkBytes = s.getBytes(gbk);
System.out.println(Arrays.toString(utf8Bytes)); // 輸出:[-28, -67, -96, -27, -91, -67, -17, -68, -120, -27, -91, -67, -16, -90, -96, -28, -72, -106, -27, -91, -81, -25, -85, -80]
System.out.println(Arrays.toString(gbkBytes)); // 輸出:[-60, -29, -70, -61, -93, -58, -46, -58, -48, -71, -95, -63]

五、Charset注意點

在Java中,Charset並不是一個線程安全的類,因此在多線程環境下需要進行同步。同時,在進行編碼和解碼時,也應該儘可能少地使用Charset。

此外,Java並沒有規定所有的Charset都必須支持所有的字符,因此在使用Charset時,一定要注意對應的編碼方案是否支持相應的字符集合。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/254871.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-15 12:13
下一篇 2024-12-15 12:13

相關推薦

  • Java JsonPath 效率優化指南

    本篇文章將深入探討Java JsonPath的效率問題,並提供一些優化方案。 一、JsonPath 簡介 JsonPath是一個可用於從JSON數據中獲取信息的庫。它提供了一種DS…

    編程 2025-04-29
  • java client.getacsresponse 編譯報錯解決方法

    java client.getacsresponse 編譯報錯是Java編程過程中常見的錯誤,常見的原因是代碼的語法錯誤、類庫依賴問題和編譯環境的配置問題。下面將從多個方面進行分析…

    編程 2025-04-29
  • Java騰訊雲音視頻對接

    本文旨在從多個方面詳細闡述Java騰訊雲音視頻對接,提供完整的代碼示例。 一、騰訊雲音視頻介紹 騰訊雲音視頻服務(Cloud Tencent Real-Time Communica…

    編程 2025-04-29
  • Java Bean加載過程

    Java Bean加載過程涉及到類加載器、反射機制和Java虛擬機的執行過程。在本文中,將從這三個方面詳細闡述Java Bean加載的過程。 一、類加載器 類加載器是Java虛擬機…

    編程 2025-04-29
  • Java Milvus SearchParam withoutFields用法介紹

    本文將詳細介紹Java Milvus SearchParam withoutFields的相關知識和用法。 一、什麼是Java Milvus SearchParam without…

    編程 2025-04-29
  • Java 8中某一周的周一

    Java 8是Java語言中的一個版本,於2014年3月18日發布。本文將從多個方面對Java 8中某一周的周一進行詳細的闡述。 一、數組處理 Java 8新特性之一是Stream…

    編程 2025-04-29
  • Java判斷字符串是否存在多個

    本文將從以下幾個方面詳細闡述如何使用Java判斷一個字符串中是否存在多個指定字符: 一、字符串遍歷 字符串是Java編程中非常重要的一種數據類型。要判斷字符串中是否存在多個指定字符…

    編程 2025-04-29
  • VSCode為什麼無法運行Java

    解答:VSCode無法運行Java是因為默認情況下,VSCode並沒有集成Java運行環境,需要手動添加Java運行環境或安裝相關插件才能實現Java代碼的編寫、調試和運行。 一、…

    編程 2025-04-29
  • Java任務下發回滾系統的設計與實現

    本文將介紹一個Java任務下發回滾系統的設計與實現。該系統可以用於執行複雜的任務,包括可回滾的任務,及時恢復任務失敗前的狀態。系統使用Java語言進行開發,可以支持多種類型的任務。…

    編程 2025-04-29
  • Java 8 Group By 會影響排序嗎?

    是的,Java 8中的Group By會對排序產生影響。本文將從多個方面探討Group By對排序的影響。 一、Group By的概述 Group By是SQL中的一種常見操作,它…

    編程 2025-04-29

發表回復

登錄後才能評論