php漢字轉unicode,php 數字轉字符

本文目錄一覽:

怎麼用PHP把unicode轉成utf8

function unescape($str) {

$str = rawurldecode($str);

preg_match_all(“/(?:%u.{4})|.{4};|\d+;|.+/U”,$str,$r);

$ar = $r[0];

//print_r($ar);

foreach($ar as $k=$v) {

if(substr($v,0,2) == “%u”){

$ar[$k] = iconv(“UCS-2BE”,”UTF-8″,pack(“H4”,substr($v,-4)));

}

elseif(substr($v,0,3) == “”){

$ar[$k] = iconv(“UCS-2BE”,”UTF-8″,pack(“H4”,substr($v,3,-1)));

}

elseif(substr($v,0,2) == “”) {

$ar[$k] = iconv(“UCS-2BE”,”UTF-8″,pack(“n”,substr($v,2,-1)));

}

}

return join(“”,$ar);

}

echo unescape(“紫星藍”);

今天有用戶反饋,表單系統用戶提交的數據中文會亂碼。測試發現問題出在 iconv 轉換上。

iconv(‘UCS-2’, ‘GBK’, ‘中文’)

Google 搜索發現,原因是 Linux 服務器上 UCS-2 編碼方式與 Winodws 不一致。

於是,我改成 iconv(‘UCS-2BE’, ‘GBK’, ‘中文’) 試試,中文正常了

以下是有關兩個平台 UCS-2 編碼的潛規則:

1, UCS-2 不等於 UTF-16。 UTF-16 每個字節使用 ASCII 字符範圍編碼,而 UCS-2 對每個字節的編碼可以超出 ASCII 字符範圍。UCS-2 和 UTF-16 對每個字符至多佔兩個字節,但是他們的編碼是不一樣的。

2, 對於 UCS-2, windows 下默認是 UCS-2LE。用 MultibyteToWidechar(或者A2W)生成的是 UCS-2LE 的 unicode。windows記事本可以將文本保存為 UCS-2BE,相當於多了層轉換。

3, 對於 UCS-2, linux 下默認是 UCS-2BE。用iconv(指定UCS-2)來轉換生成的是 UCS-2BE 的 unicode。如果轉換windows平台過來的 UCS-2, 需要指定 UCS-2LE。

4, 鑒於windows和linux等多個平台對 UCS-2 的理解不同(UCS-2LE,UCS-2BE)。MS 主張 unicode 有個引導標誌(UCS-2LE FFFE, UCS-2BE FEFF),以表明下面的字符是 unicode 並且判別 big-endian 或 little-endian。 所以從 windows 平台過來的數據發現有這個前綴,不用慌張。

5, linux 的編碼輸出,比如從文件輸出,從 printf 輸出,需要控制台做適當的編碼匹配(如果編碼不匹配,一般和該程序編譯時的編碼有若干關係),而控制台的轉換輸入需要查看當前的系統編碼。比如控制台當前的編碼是 UTF-8, 那麼 UTF-8 編碼的東西能正確顯示,GBK 就不能;同樣,當前編碼是 GBK, 就能顯示 GBK 編碼,後來的系統應該更智能的處理好更多的轉換了。不過通過 putty 等終端還是需要設置好終端的編碼轉換以解除亂碼的煩惱。

PHP中對漢字進行UNICODE編碼和解碼的實現

//將內容進行UNICODE編碼

function unicode_encode($name)

{

$name = iconv(‘UTF-8’, ‘UCS-2’, $name);

$len = strlen($name);

$str = ”;

for ($i = 0; $i $len – 1; $i = $i + 2)

{

$c = $name[$i];

$c2 = $name[$i + 1];

if (ord($c) 0)

{ // 兩個字節的文字

$str .= ‘\u’.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);

}

else

{

$str .= $c2;

}

}

return $str;

}

$name = ‘MY,你大爺的’;

$unicode_name=unicode_encode($name);

echo ‘h3’.$unicode_name.’/h3′;

// 將UNICODE編碼後的內容進行解碼

function unicode_decode($name)

{

// 轉換編碼,將Unicode編碼轉換成可以瀏覽的utf-8編碼

$pattern = ‘/([\w]+)|(\\\u([\w]{4}))/i’;

preg_match_all($pattern, $name, $matches);

if (!empty($matches))

{

$name = ”;

for ($j = 0; $j count($matches[0]); $j++)

{

$str = $matches[0][$j];

if (strpos($str, ‘\\u’) === 0)

{

$code = base_convert(substr($str, 2, 2), 16, 10);

$code2 = base_convert(substr($str, 4), 16, 10);

$c = chr($code).chr($code2);

$c = iconv(‘UCS-2’, ‘UTF-8’, $c);

$name .= $c;

}

else

{

$name .= $str;

}

}

}

return $name;

}

echo ‘MY,\u4f60\u5927\u7237\u7684 – ‘.unicode_decode($unicode_name);

php中把漢字轉換成unicode方法

把那個hidemail函數改改不就行了。。 ?php //將utf8編碼的漢字轉換為unicode function htou($c){ $n = (ord($c[0]) 0x1f) 12; $n += (ord($c[1]) 0x3f) 6; $n += ord($c[2]) 0x3f; return $n; } //在代碼中隱藏utf8格式的字符串 function my_utf8_unicode($str) { $encode=”; for($i=0;$istrlen($str);$i++){ if(ord(substr($str,$i,1)) 0xa0){ $encode.=”.htou(substr($str,$i,3)).’;’; $i+=2; }else{ $encode.=”.ord($str[$i]).’;’; } } return $encode; } echo my_utf8_unicode(“哈哈ABC”); ?

PHP UNICODE 編碼轉換

Unicode是一個字符集,Unicode是定長的都為雙字節.

這裡我們常用的是utf8字符集編碼,樓主是說的Unicode轉換為UTF-8吧。

/**

* Unicode字符轉換成utf8字符

* @param [type] $unicode_str Unicode字符

* @return [type] Utf-8字符

*/

function unicode_to_utf8($unicode_str) {

$utf8_str = ”;

$code = intval(hexdec($unicode_str));

//這裡注意轉換出來的code一定得是整形,這樣才會正確的按位操作

$ord_1 = decbin(0xe0 | ($code 12));

$ord_2 = decbin(0x80 | (($code 6) 0x3f));

$ord_3 = decbin(0x80 | ($code 0x3f));

$utf8_str = chr(bindec($ord_1)) . chr(bindec($ord_2)) . chr(bindec($ord_3));

return $utf8_str;

}

php如何實現文字轉Unicode編碼

為了要將Unicode轉換為UTF-8,當然要知道他們的區別到底在什麼地方。下面來看一下,在Unicode中的編碼是怎樣轉換成UTF-8的,在UTF-8中,如果一個字符的字節小於0x80(128)則為ASCII字符,佔一個字節,可以不用轉換,因為UTF-8兼容ASCII編碼。假如在Unicode中漢字“你”的編碼為“u4F60”,把它轉換為二進制為100111101100000,然後按照UTF-8的方法進行轉換。可以將Unicode二進制從低位往高位取出二進制數字,每次取6位,如上述的二進制就可以分別取出為如下所示的格式,前面按格式填補,不足8位用0填補。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/296185.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-27 12:58
下一篇 2024-12-27 12:58

相關推薦

  • 英語年齡用連字符號(Hyphenation for English Age)

    英語年齡通常使用連字符號表示,比如 “five-year-old boy”。本文將從多個方面探討英語年齡的連字符使用問題。 一、英語年齡的表達方式 英語中表…

    編程 2025-04-29
  • PHP和Python哪個好找工作?

    PHP和Python都是非常流行的編程語言,它們被廣泛應用於不同領域的開發中。但是,在考慮擇業方向的時候,很多人都會有一個問題:PHP和Python哪個好找工作?這篇文章將從多個方…

    編程 2025-04-29
  • Python循環符合要求數字求和

    這篇文章將詳細介紹如何通過Python循環符合要求數字求和。如果你想用Python求和但又不想手動輸入數字,那麼本文將是一個不錯的選擇。 一、使用while循環實現求和 sum =…

    編程 2025-04-29
  • Python字符轉列表指南

    Python是一個極為流行的腳本語言,在數據處理、數據分析、人工智能等領域廣泛應用。在很多場景下需要將字符串轉換為列表,以便於操作和處理,本篇文章將從多個方面對Python字符轉列…

    編程 2025-04-29
  • Python學習筆記:去除字符串最後一個字符的方法

    本文將從多個方面詳細闡述如何通過Python去除字符串最後一個字符,包括使用切片、pop()、刪除、替換等方法來實現。 一、字符串切片 在Python中,可以通過字符串切片的方式來…

    編程 2025-04-29
  • Python基本數字類型

    本文將介紹Python中基本數字類型,包括整型、布爾型、浮點型、複數型,並提供相應的代碼示例以便讀者更好的理解。 一、整型 整型即整數類型,Python中的整型沒有大小限制,所以可…

    編程 2025-04-29
  • Python數字求和怎麼寫

    在Python中實現數字求和非常簡單,下面將從多個方面對Python數字求和的實現方法做詳細的闡述。 一、直接使用“+”符號進行求和 a = 10 b = 20 c = a + b…

    編程 2025-04-29
  • Python打印數字三角形

    本文將詳細闡述如何使用Python打印數字三角形,包括從基本代碼實現到進階操作的應用。通過本文的學習,您可以掌握Python的基礎語法,同時加深對Python循環和函數的理解,提高…

    編程 2025-04-29
  • 進擊的漢字拆字窗

    進擊的漢字拆字窗是一款非常有用的中文工具,它可以幫助人們更好的學習漢字,了解漢字的含義,以及更好的了解漢字在中文中的運用和意義。 一、功能介紹 進擊的漢字拆字窗主要有以下幾個功能:…

    編程 2025-04-29
  • Python提取連續數字

    本文將介紹如何使用Python提取一個字符串中的連續數字。 一、使用正則表達式提取 正則表達式是一種可以匹配文本片段的模式。Python內置了re模塊,可以使用正則表達式進行字符串…

    編程 2025-04-29

發表回復

登錄後才能評論