講解漢字內碼正確形式「中文編碼格式有哪些」

在碼農的世界中除了Bug,還有一個比較頭疼的事情,那就是中文編碼格式,對於普通人,你現在看到的中文,或者說你看到的所有中文,其實都是中文,你可能根本就不關心它是什麼編碼格式,但是程序員卻不得不關注中文的編碼格式,或者代碼的編碼格式,不然就會出現下面這種:

中文字符編碼格式的驗證和證明
中文字符編碼格式的驗證和證明
中文字符編碼格式的驗證和證明

可能已經亂瞎你們的眼了,其實它們正常如下:

中文字符編碼格式的驗證和證明

中文字符編碼格式的驗證和證明這就是編碼格式導致的,亂到火星人也無法認識,編碼不僅僅會導致顯示出現短路,還會讓程序無法正常運行,特別是在加解密或者驗簽中,如果不按規定的編碼格式編碼,經常會遇見:簽名失敗,驗簽不符這種的錯誤。今天分享的是如何證明編碼的格式:

第一步:複製亂碼的字符串(這個是還不要叫中文了,誰也不認識了),利用UE轉16進制查看亂碼處對應的16進制。如查看‘一個程序員’對應的16進制:

中文字符編碼格式的驗證和證明第二步:在Java代碼中查詢‘一個程序員’對應的UTF-8和GBK 16進制表示;

中文字符編碼格式的驗證和證明比較就可以發現UE中的‘一個程序員’的編碼格式是GBK的,這樣就可以證明對應中文的編碼格式了。

獲取字符串編碼格式的16進制的Java代碼如下:

中文字符編碼格式的驗證和證明

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/273721.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-17 14:07
下一篇 2024-12-17 14:07

相關推薦

發表回復

登錄後才能評論