本文目錄一覽:
- 1、php裡面怎樣把utf-8編碼的字元串 (如 \u5e7f), 重新解碼成中文,多謝
- 2、PHP如何把數組裡的中文Unicode轉換成Utf-8編碼?
- 3、PHP UNICODE 編碼轉換
- 4、在php中,怎樣把字元串轉為UTF-8位元組數組
- 5、php中怎麼將GB18030轉換為UTF-8編碼
- 6、如何將phpinfo字元串類型轉換
php裡面怎樣把utf-8編碼的字元串 (如 \u5e7f), 重新解碼成中文,多謝
這種字元串是unicode編碼的,而不是utf-8。json_decode()可以自動將json中的unicode字元串轉換為utf-8。你可以自己構造一個json來實現。
12345?php$str = ‘\u5e7f\u4e1c\u6df1\u5733’;$json = ‘{“foo”:”‘ . $str . ‘”}’;$d = json_decode($json, true);$str = $d[‘foo’]; // 這個就是你想要的
望採納!
PHP如何把數組裡的中文Unicode轉換成Utf-8編碼?
很明顯你截的圖是是JSON數據,如果是數組應二維數組的括弧應該是[]而不是{}。
所以轉換應該使用json_decode。比如對象名為$list,則:$list = json_decode($list, true);
出現中文Unicode的問題是,存儲數據轉成json時第二個參數使用錯誤,包含中文而不轉義的需要使用JSON_UNESCAPED_UNICODE;這樣存到資料庫才是中文。如:$list = json_encode($list, JSON_UNESCAPED_UNICODE);
PHP UNICODE 編碼轉換
Unicode是一個字符集,Unicode是定長的都為雙位元組.
這裡我們常用的是utf8字符集編碼,樓主是說的Unicode轉換為UTF-8吧。
/**
* Unicode字元轉換成utf8字元
* @param [type] $unicode_str Unicode字元
* @return [type] Utf-8字元
*/
function unicode_to_utf8($unicode_str) {
$utf8_str = ”;
$code = intval(hexdec($unicode_str));
//這裡注意轉換出來的code一定得是整形,這樣才會正確的按位操作
$ord_1 = decbin(0xe0 | ($code 12));
$ord_2 = decbin(0x80 | (($code 6) 0x3f));
$ord_3 = decbin(0x80 | ($code 0x3f));
$utf8_str = chr(bindec($ord_1)) . chr(bindec($ord_2)) . chr(bindec($ord_3));
return $utf8_str;
}
在php中,怎樣把字元串轉為UTF-8位元組數組
字元串本身就可以當做字元數組處理。
譬如char *a= “abcdefg”;
printf(“%c\n”,a[0]);
結果即為’a’
php中怎麼將GB18030轉換為UTF-8編碼
可以使用iconv函數對編碼進行轉換,iconv(“gb18030”, “utf-8”, “要轉換的字元串”);
iconv詳細用法如下:
iconv — 字元串按要求的字元編碼來轉換
string iconv ( string $in_charset, string $out_charset, string $str)
將字元串 str 從 in_charset 轉換編碼到 out_charset。
參數:
in_charset:輸入的字符集。
out_charset:輸出的字符集。
如果在 out_charset 後添加了字元串 //TRANSLIT,將啟用轉寫(transliteration)功能。
這個意思是,當一個字元不能被目標字符集所表示時,它可以通過一個或多個形似的字元來近似表達。
如果添加了字元串 //IGNORE,不能以目標字符集表達的字元將被默默丟棄。
否則,str 從第一個無效字元開始截斷並導致一個 E_NOTICE。
str:要轉換的字元串。
返回值:
返迴轉換後的字元串, 或者在失敗時返回 FALSE。
如何將phpinfo字元串類型轉換
php中iconv、mb_convert_encoding函數字元編碼轉換詳解如下:
iconv函數庫能夠完成各種字符集間的轉換,是php編程中不可缺少的基礎函數庫。
用法如下:
$string = “親愛的朋友歡迎訪問博客,希望給您帶來一點點的幫助!”;
iconv(“utf8″,”gbk”,$string)//將字元串string 編碼由utf8轉變成gbk;
擴展如下:
echo [Math Processing Error]str=′好,歡迎訪問博客,該博客記錄一個程序員的成長過程!′;echo′br/′;echoiconv(′GB2312′,′UTF−8′,str); //將字元串的編碼從GB2312轉到UTF-8
echo ‘br /’;
echo iconv_substr([Math Processing Error]str,1,1,′UTF−8′);//按字元個數截取而非位元組printr(iconvgetencoding());//得到當前頁面編碼信息echoiconvstrlen(str, ‘UTF-8’); //得到設定編碼的字元串長度
//也有這樣用的
[Math Processing Error]content=iconv(“UTF−8″,”gbk//TRANSLIT”,content);
備註:
1、iconv不是php的默認函數,也是默認安裝的模塊。需要安裝才能用的。
如果是windows2000+php,你可以修改php.ini文件,將extension=php_iconv.dll前的”;”去掉,同時你要copy你的原php安裝文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是這個目錄,我本地的沒有操作這一步)
在linux環境下,用靜態安裝的方式,在configure時加多一項 –with-iconv就可以了,phpinfo看得到iconv的項。(Linux7.3+Apache4.06+php4.3.2);
到此php中的iconv 介紹完畢
2、用iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312, 發現只有用iconv函數把抓取過來的數據一轉碼數據就會無緣無故的少一些。原因是這樣的:
string iconv ( string in_charset, string out_charset, string str )
注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個後綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字元變成一個或多個近似的字元,//IGNORE 會忽略掉不能轉化的字元,而默認效果是從第一個非法字元截斷。 被截斷了,當然就會少了;
可以這樣修改iconv(“UTF-8″,”GB2312//IGNORE”,$string) 會忽略掉不能轉化的字元;
附加:
PHP中的mb_convert_encoding與iconv函數介紹
mb_convert_encoding這個函數是用來轉換編碼的,和iconv函數差不多。
英文一般不會存在編碼問題,只有中文數據才會有這個問題。比如用Zend Studio或Editplus寫程序時,用的是gbk編碼,如果數據需要入資料庫,而資料庫的編碼為utf8時,這時就要把數據進行編碼轉換,不然進到資料庫就會變成亂碼。
做一個GBK To UTF-8
?php
header(“content-Type: text/html; charset=Utf-8”); //設置字元的編碼是utp-8
echo mb_convert_encoding(“你系我的友仔”, “UTF-8”, “GBK”);
?
再做GB2312 To Big5
?php
header(“content-Type: text/html; charset=big5”);
echo mb_convert_encoding(“朋友”, “big5”, “GB2312”);
?
不過要使用上面的函數需要安裝但是需要先enable mbstring 擴展庫,道理還是一樣的,修改php.ini。
PHP中的另外一個函數iconv也是用來轉換字元串編碼的,與上函數功能相似。
下面還有一些詳細的例子:
iconv — Convert string to requested character encoding
(PHP 4 = 4.0.5, PHP 5)
mb_convert_encoding — Convert character encoding
(PHP 4 = 4.0.6, PHP 5)
用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding]
需要先enable mbstring 擴展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ;
去掉mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;
那為何還要講解 這個 mb_convert_encoding()函數呢?答案如下:
發現iconv在轉換字元」—」到gb2312時會出錯,如果沒有ignore參數,所有該字元後面的字元串都無法被保存。不管怎麼樣,這個」—」都無法轉換成功,無法輸出。
另外mb_convert_encoding沒有這個bug.
一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數.
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/253410.html