php字元串如何轉utf8編碼,字元串轉為utf8編碼

本文目錄一覽:

php裡面怎樣把utf-8編碼的字元串 (如 \u5e7f), 重新解碼成中文,多謝

這種字元串是unicode編碼的,而不是utf-8。json_decode()可以自動將json中的unicode字元串轉換為utf-8。你可以自己構造一個json來實現。

12345?php$str = ‘\u5e7f\u4e1c\u6df1\u5733’;$json = ‘{“foo”:”‘ . $str . ‘”}’;$d = json_decode($json, true);$str = $d[‘foo’]; // 這個就是你想要的

望採納!

PHP如何把數組裡的中文Unicode轉換成Utf-8編碼?

很明顯你截的圖是是JSON數據,如果是數組應二維數組的括弧應該是[]而不是{}。

所以轉換應該使用json_decode。比如對象名為$list,則:$list = json_decode($list, true);

出現中文Unicode的問題是,存儲數據轉成json時第二個參數使用錯誤,包含中文而不轉義的需要使用JSON_UNESCAPED_UNICODE;這樣存到資料庫才是中文。如:$list = json_encode($list, JSON_UNESCAPED_UNICODE);

PHP UNICODE 編碼轉換

Unicode是一個字符集,Unicode是定長的都為雙位元組.

這裡我們常用的是utf8字符集編碼,樓主是說的Unicode轉換為UTF-8吧。

/**

* Unicode字元轉換成utf8字元

* @param [type] $unicode_str Unicode字元

* @return [type] Utf-8字元

*/

function unicode_to_utf8($unicode_str) {

$utf8_str = ”;

$code = intval(hexdec($unicode_str));

//這裡注意轉換出來的code一定得是整形,這樣才會正確的按位操作

$ord_1 = decbin(0xe0 | ($code 12));

$ord_2 = decbin(0x80 | (($code 6) 0x3f));

$ord_3 = decbin(0x80 | ($code 0x3f));

$utf8_str = chr(bindec($ord_1)) . chr(bindec($ord_2)) . chr(bindec($ord_3));

return $utf8_str;

}

在php中,怎樣把字元串轉為UTF-8位元組數組

字元串本身就可以當做字元數組處理。

譬如char *a= “abcdefg”;

printf(“%c\n”,a[0]);

結果即為’a’

php中怎麼將GB18030轉換為UTF-8編碼

可以使用iconv函數對編碼進行轉換,iconv(“gb18030”, “utf-8”, “要轉換的字元串”);

iconv詳細用法如下:

iconv — 字元串按要求的字元編碼來轉換

string iconv ( string $in_charset, string $out_charset, string $str)

將字元串 str 從 in_charset 轉換編碼到 out_charset。

參數:

in_charset:輸入的字符集。

out_charset:輸出的字符集。

如果在 out_charset 後添加了字元串 //TRANSLIT,將啟用轉寫(transliteration)功能。

這個意思是,當一個字元不能被目標字符集所表示時,它可以通過一個或多個形似的字元來近似表達。

如果添加了字元串 //IGNORE,不能以目標字符集表達的字元將被默默丟棄。

否則,str 從第一個無效字元開始截斷並導致一個 E_NOTICE。

str:要轉換的字元串。

返回值:

返迴轉換後的字元串, 或者在失敗時返回 FALSE。

如何將phpinfo字元串類型轉換

php中iconv、mb_convert_encoding函數字元編碼轉換詳解如下:

iconv函數庫能夠完成各種字符集間的轉換,是php編程中不可缺少的基礎函數庫。

用法如下:

$string = “親愛的朋友歡迎訪問博客,希望給您帶來一點點的幫助!”;

iconv(“utf8″,”gbk”,$string)//將字元串string  編碼由utf8轉變成gbk;

擴展如下:

echo [Math Processing Error]str=′好,歡迎訪問博客,該博客記錄一個程序員的成長過程!′;echo′br/′;echoiconv(′GB2312′,′UTF−8′,str); //將字元串的編碼從GB2312轉到UTF-8

echo ‘br /’;

echo iconv_substr([Math Processing Error]str,1,1,′UTF−8′);//按字元個數截取而非位元組printr(iconvgetencoding());//得到當前頁面編碼信息echoiconvstrlen(str, ‘UTF-8’); //得到設定編碼的字元串長度

//也有這樣用的

[Math Processing Error]content=iconv(“UTF−8″,”gbk//TRANSLIT”,content);

備註:

1、iconv不是php的默認函數,也是默認安裝的模塊。需要安裝才能用的。

如果是windows2000+php,你可以修改php.ini文件,將extension=php_iconv.dll前的”;”去掉,同時你要copy你的原php安裝文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是這個目錄,我本地的沒有操作這一步)

在linux環境下,用靜態安裝的方式,在configure時加多一項 –with-iconv就可以了,phpinfo看得到iconv的項。(Linux7.3+Apache4.06+php4.3.2);

到此php中的iconv 介紹完畢

2、用iconv函數把抓取來過的utf-8編碼的頁面轉成gb2312, 發現只有用iconv函數把抓取過來的數據一轉碼數據就會無緣無故的少一些。原因是這樣的:

string iconv ( string in_charset, string out_charset, string str )

注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個後綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字元變成一個或多個近似的字元,//IGNORE 會忽略掉不能轉化的字元,而默認效果是從第一個非法字元截斷。 被截斷了,當然就會少了;

可以這樣修改iconv(“UTF-8″,”GB2312//IGNORE”,$string)  會忽略掉不能轉化的字元;

附加:

PHP中的mb_convert_encoding與iconv函數介紹

mb_convert_encoding這個函數是用來轉換編碼的,和iconv函數差不多。

英文一般不會存在編碼問題,只有中文數據才會有這個問題。比如用Zend Studio或Editplus寫程序時,用的是gbk編碼,如果數據需要入資料庫,而資料庫的編碼為utf8時,這時就要把數據進行編碼轉換,不然進到資料庫就會變成亂碼。

做一個GBK To UTF-8

 ?php

header(“content-Type: text/html; charset=Utf-8”); //設置字元的編碼是utp-8

echo mb_convert_encoding(“你系我的友仔”, “UTF-8”, “GBK”);

?

再做GB2312 To Big5

 ?php

header(“content-Type: text/html; charset=big5”);

echo mb_convert_encoding(“朋友”, “big5”, “GB2312”);

?

不過要使用上面的函數需要安裝但是需要先enable mbstring 擴展庫,道理還是一樣的,修改php.ini。

PHP中的另外一個函數iconv也是用來轉換字元串編碼的,與上函數功能相似。

下面還有一些詳細的例子:

iconv — Convert string to requested character encoding

(PHP 4 = 4.0.5, PHP 5)

mb_convert_encoding — Convert character encoding

(PHP 4 = 4.0.6, PHP 5)

用法:

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding]

需要先enable mbstring 擴展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ;

去掉mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;

那為何還要講解 這個 mb_convert_encoding()函數呢?答案如下:

發現iconv在轉換字元」—」到gb2312時會出錯,如果沒有ignore參數,所有該字元後面的字元串都無法被保存。不管怎麼樣,這個」—」都無法轉換成功,無法輸出。

另外mb_convert_encoding沒有這個bug.

一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數.

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/253410.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-14 02:16
下一篇 2024-12-14 02:16

相關推薦

  • PHP和Python哪個好找工作?

    PHP和Python都是非常流行的編程語言,它們被廣泛應用於不同領域的開發中。但是,在考慮擇業方向的時候,很多人都會有一個問題:PHP和Python哪個好找工作?這篇文章將從多個方…

    編程 2025-04-29
  • Python字元串寬度不限制怎麼打代碼

    本文將為大家詳細介紹Python字元串寬度不限制時如何打代碼的幾個方面。 一、保持代碼風格的統一 在Python字元串寬度不限制的情況下,我們可以寫出很長很長的一行代碼。但是,為了…

    編程 2025-04-29
  • Python中將字元串轉化為浮點數

    本文將介紹在Python中將字元串轉化為浮點數的常用方法。在介紹方法之前,我們先來思考一下這個問題應該如何解決。 一、eval函數 在Python中,最簡單、最常用的將字元串轉化為…

    編程 2025-04-29
  • Java判斷字元串是否存在多個

    本文將從以下幾個方面詳細闡述如何使用Java判斷一個字元串中是否存在多個指定字元: 一、字元串遍歷 字元串是Java編程中非常重要的一種數據類型。要判斷字元串中是否存在多個指定字元…

    編程 2025-04-29
  • Python學習筆記:去除字元串最後一個字元的方法

    本文將從多個方面詳細闡述如何通過Python去除字元串最後一個字元,包括使用切片、pop()、刪除、替換等方法來實現。 一、字元串切片 在Python中,可以通過字元串切片的方式來…

    編程 2025-04-29
  • PHP怎麼接幣

    想要在自己的網站或應用中接受比特幣等加密貨幣的支付,就需要對該加密貨幣擁有一定的了解,並使用對應的API進行開發。本文將從多個方面詳細闡述如何使用PHP接受加密貨幣的支付。 一、環…

    編程 2025-04-29
  • Python如何將字元串1234變成數字1234

    Python作為一種廣泛使用的編程語言,對於數字和字元串的處理提供了很多便捷的方式。如何將字元串「1234」轉化成數字「1234」呢?下面將從多個方面詳細闡述Python如何將字元…

    編程 2025-04-29
  • Python int轉二進位字元串

    本文將從以下幾個方面對Python中將int類型轉換為二進位字元串進行詳細闡述: 一、int類型和二進位字元串的定義 在Python中,int類型表示整數,二進位字元串則是由0和1…

    編程 2025-04-29
  • 用title和capitalize美觀處理Python字元串

    在Python中,字元串是最常用的數據類型之一。對字元串的美觀處理是我們在實際開發中經常需要的任務之一。Python內置了一些方法,如title和capitalize,可以幫助我們…

    編程 2025-04-28
  • Python 提取字元串中的電話號碼

    Python 是一種高級的、面向對象的編程語言,它具有簡單易學、開發迅速、代碼簡潔等特點,廣泛應用於 Web 開發、數據科學、人工智慧等領域。在 Python 中,提取字元串中的電…

    編程 2025-04-28

發表回復

登錄後才能評論