php字元串如何轉utf8編碼,字元串轉為utf8編碼

本文目錄一覽：

1、php裡面怎樣把utf-8編碼的字元串 (如 \u5e7f), 重新解碼成中文,多謝
2、PHP如何把數組裡的中文Unicode轉換成Utf-8編碼？
3、PHP UNICODE 編碼轉換
4、在php中，怎樣把字元串轉為UTF-8位元組數組
5、php中怎麼將GB18030轉換為UTF-8編碼
6、如何將phpinfo字元串類型轉換

php裡面怎樣把utf-8編碼的字元串 (如 \u5e7f), 重新解碼成中文,多謝

這種字元串是unicode編碼的，而不是utf-8。json_decode()可以自動將json中的unicode字元串轉換為utf-8。你可以自己構造一個json來實現。

12345?php$str = ‘\u5e7f\u4e1c\u6df1\u5733’;$json = ‘{“foo”:”‘ . $str . ‘”}’;$d = json_decode($json, true);$str = $d[‘foo’]; // 這個就是你想要的

望採納！

PHP如何把數組裡的中文Unicode轉換成Utf-8編碼？

很明顯你截的圖是是JSON數據，如果是數組應二維數組的括弧應該是[]而不是{}。

所以轉換應該使用json_decode。比如對象名為$list，則：$list = json_decode($list, true);

出現中文Unicode的問題是，存儲數據轉成json時第二個參數使用錯誤，包含中文而不轉義的需要使用JSON_UNESCAPED_UNICODE；這樣存到資料庫才是中文。如：$list = json_encode($list, JSON_UNESCAPED_UNICODE);

PHP UNICODE 編碼轉換

Unicode是一個字符集,Unicode是定長的都為雙位元組.

這裡我們常用的是utf8字符集編碼，樓主是說的Unicode轉換為UTF-8吧。

/**

* Unicode字元轉換成utf8字元

* @param [type] $unicode_str Unicode字元

* @return [type] Utf-8字元

function unicode_to_utf8($unicode_str) {

$utf8_str = ”;

$code = intval(hexdec($unicode_str));

//這裡注意轉換出來的code一定得是整形，這樣才會正確的按位操作

$ord_1 = decbin(0xe0 | ($code 12));

$ord_2 = decbin(0x80 | (($code 6) 0x3f));

$ord_3 = decbin(0x80 | ($code 0x3f));

$utf8_str = chr(bindec($ord_1)) . chr(bindec($ord_2)) . chr(bindec($ord_3));

return $utf8_str;

}

在php中，怎樣把字元串轉為UTF-8位元組數組

字元串本身就可以當做字元數組處理。

譬如char *a= “abcdefg”;

printf(“%c\n”,a[0]);

結果即為’a’

php中怎麼將GB18030轉換為UTF-8編碼

可以使用iconv函數對編碼進行轉換，iconv(“gb18030”, “utf-8”, “要轉換的字元串”);

iconv詳細用法如下：

iconv — 字元串按要求的字元編碼來轉換

string iconv ( string $in_charset, string $out_charset, string $str)

將字元串 str 從 in_charset 轉換編碼到 out_charset。

參數：

in_charset：輸入的字符集。

out_charset：輸出的字符集。

如果在 out_charset 後添加了字元串 //TRANSLIT，將啟用轉寫（transliteration）功能。

這個意思是，當一個字元不能被目標字符集所表示時，它可以通過一個或多個形似的字元來近似表達。

如果添加了字元串 //IGNORE，不能以目標字符集表達的字元將被默默丟棄。

否則，str 從第一個無效字元開始截斷並導致一個 E_NOTICE。

str：要轉換的字元串。

返回值：

返迴轉換後的字元串，或者在失敗時返回 FALSE。

如何將phpinfo字元串類型轉換

php中iconv、mb_convert_encoding函數字元編碼轉換詳解如下：

iconv函數庫能夠完成各種字符集間的轉換，是php編程中不可缺少的基礎函數庫。

用法如下：

$string = “親愛的朋友歡迎訪問博客，希望給您帶來一點點的幫助！”;

iconv(“utf8″,”gbk”,$string)//將字元串string 編碼由utf8轉變成gbk；

擴展如下：

echo [Math Processing Error]str=′好,歡迎訪問博客，該博客記錄一個程序員的成長過程!′;echo′br/′;echoiconv(′GB2312′,′UTF−8′,str); //將字元串的編碼從GB2312轉到UTF-8

echo ‘br /’;

echo iconv_substr([Math Processing Error]str,1,1,′UTF−8′);//按字元個數截取而非位元組printr(iconvgetencoding());//得到當前頁面編碼信息echoiconvstrlen(str, ‘UTF-8’); //得到設定編碼的字元串長度

//也有這樣用的

[Math Processing Error]content=iconv(“UTF−8″,”gbk//TRANSLIT”,content);

備註：

1、iconv不是php的默認函數，也是默認安裝的模塊。需要安裝才能用的。

如果是windows2000+php，你可以修改php.ini文件，將extension=php_iconv.dll前的”;”去掉，同時你要copy你的原php安裝文件下的iconv.dll到你的winnt/system32下（如果你的dll指向的是這個目錄，我本地的沒有操作這一步）

在linux環境下，用靜態安裝的方式，在configure時加多一項 –with-iconv就可以了，phpinfo看得到iconv的項。(Linux7.3+Apache4.06+php4.3.2)；

到此php中的iconv 介紹完畢

2、用iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312，發現只有用iconv函數把抓取過來的數據一轉碼數據就會無緣無故的少一些。原因是這樣的：

string iconv ( string in_charset, string out_charset, string str )

注意：第二個參數，除了可以指定要轉化到的編碼以外，還可以增加兩個後綴：//TRANSLIT 和 //IGNORE，其中 //TRANSLIT 會自動將不能直接轉化的字元變成一個或多個近似的字元，//IGNORE 會忽略掉不能轉化的字元，而默認效果是從第一個非法字元截斷。被截斷了，當然就會少了；

可以這樣修改iconv(“UTF-8″,”GB2312//IGNORE”,$string) 會忽略掉不能轉化的字元；

附加：

PHP中的mb_convert_encoding與iconv函數介紹

mb_convert_encoding這個函數是用來轉換編碼的，和iconv函數差不多。

英文一般不會存在編碼問題，只有中文數據才會有這個問題。比如用Zend Studio或Editplus寫程序時，用的是gbk編碼，如果數據需要入資料庫，而資料庫的編碼為utf8時，這時就要把數據進行編碼轉換，不然進到資料庫就會變成亂碼。

做一個GBK To UTF-8

?php

header(“content-Type: text/html; charset=Utf-8”); //設置字元的編碼是utp-8

echo mb_convert_encoding(“你系我的友仔”, “UTF-8”, “GBK”);

再做GB2312 To Big5

?php

header(“content-Type: text/html; charset=big5”);

echo mb_convert_encoding(“朋友”, “big5”, “GB2312”);

不過要使用上面的函數需要安裝但是需要先enable mbstring 擴展庫，道理還是一樣的，修改php.ini。

PHP中的另外一個函數iconv也是用來轉換字元串編碼的，與上函數功能相似。

下面還有一些詳細的例子：

iconv — Convert string to requested character encoding

(PHP 4 = 4.0.5, PHP 5)

mb_convert_encoding — Convert character encoding

(PHP 4 = 4.0.6, PHP 5)

用法：

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding]

需要先enable mbstring 擴展庫，在 php.ini里將; extension=php_mbstring.dll 前面的 ;

去掉mb_convert_encoding 可以指定多種輸入編碼，它會根據內容自動識別,但是執行效率比iconv差太多；

那為何還要講解這個 mb_convert_encoding()函數呢？答案如下：

發現iconv在轉換字元」—」到gb2312時會出錯，如果沒有ignore參數，所有該字元後面的字元串都無法被保存。不管怎麼樣，這個」—」都無法轉換成功，無法輸出。

另外mb_convert_encoding沒有這個bug.

一般情況下用 iconv，只有當遇到無法確定原編碼是何種編碼，或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數.

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/253410.html