php位元組數,php一個漢字幾個位元組

本文目錄一覽:

php 幾個位元組 函數

有兩個函數可以取PHP字元串長度

———————————————————————-

strlen — 獲取字元串長度

int strlen ( string $string )

返回給定的字元串 string 的長度。參數 string 需要計算長度的字元串。

返回值 成功則返回字元串 string 的長度;如果 string 為空,則返回 0。

———————————————————————-

mb_strlen — 獲取字元串的長度 (PHP 4 = 4.0.6, PHP 5)

mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )

獲取一個 string 的長度。

參數 str 要檢查長度的字元串。

encoding 參數為字元編碼。如果省略,則使用內部字元編碼。

返回值

返回具有 encoding 編碼的字元串 str 包含的字元數。 多位元組的字元被計為 1。

如果給定的 encoding 無效則返回 FALSE。

特別要注意的是:

有關中文的問題。PHP內置的字元串長度函數strlen無法正確處理中文字元串,它得到的只是字元串所佔的位元組數。對於GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對於UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字佔3個位元組)。

採用mb_strlen函數可以較好地解決這個問題。mb_strlen的用法和strlen類似,只不過它有第二個可選參數用於指定字元編碼。例如得到UTF-8的字元串$str長度,可以用mb_strlen($str,’UTF-8′)。如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過mb_internal_encoding()函數得到。需要注意的是,mb_strlen並不是PHP核心函數,使用前需要確保在php.ini中載入了php_mbstring.dll,即確保「extension=php_mbstring.dll」這一行存在並且沒有被注釋掉,否則會出現未定義函數的問題。

php如何判斷一個字所佔的位元組數

GB 18030的雙位元組部分完全採用了GBK的內碼系統。在此基礎上,做了四位元組擴展,四個位元組的編碼空間依次是:0x81到0xFE,0x30到0x39,0x81到0xFE,0x30到0x39。總共1,587,600個碼位

就是說你不能僅僅判斷一個位元組,如果第二個位元組的值是在0x30到0x39範圍里時,他就是4位元組的漢字了

PHP如何獲取中文字元串長度 utf8

PHP對中文字元串的處理一直困擾於剛剛接觸PHP開發的新手程序員。下面簡要的剖析一下PHP對中文字元串長度的處理:

PHP自帶的函數如strlen()、mb_strlen()都是通過計算字元串所佔位元組數來統計字元串長度的,一個英文字元佔1位元組。例:

$enStr = 『Hello,China!』;

echo strlen($enStr); // 輸出:12

而中文則不然,做中文網站一般會選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字元,所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同,導致中文在gbk與utf-8編碼下所佔位元組也有差異。

gbk編碼下每個中文字元所佔位元組為2,例:

$zhStr = 『您好,中國!』;

echo strlen($zhStr); // 輸出:12

utf-8編碼下每個中文字元所佔位元組為3,例:

$zhStr = 『您好,中國!』;

echo strlen($zhStr); // 輸出:18

那麼如何計算這組中文字元串的長度呢?有人可能會說gbk下獲取中文字元串長度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字元串並不老實,99%的情況會以中英混合的情況出現。

這是WordPress中的一段代碼,主要思想就是先用正則將字元串分解為個體單元,然後再計算單元的個數即字元串的長度,代碼如下(只能處理utf-8編碼下的字元串):

$zhStr = 『您好,中國!』;

$str = 『Hello,中國!』;

// 計算中文字元串長度

function utf8_strlen($string = null) {

// 將字元串分解為單元

preg_match_all(「/./us」, $string, $match);

// 返回單元個數

return count($match[0]);

}

echo utf8_strlen($zhStr); // 輸出:6

echo utf8_strlen($str); // 輸出:9

php 整型占幾個位元組

據官方資料:

整型數的字長和平台有關,儘管通常最大值是大約二十億(32 位有符號)。 PHP 不支持無符號整數。Integer值的字長可以用常量PHP_INT_SIZE來表示,自 PHP 4.4.0 和 PHP 5.0.5後,最大值可以用常量PHP_INT_MAX來表示。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/243357.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 12:56
下一篇 2024-12-12 12:56

相關推薦

  • PHP和Python哪個好找工作?

    PHP和Python都是非常流行的編程語言,它們被廣泛應用於不同領域的開發中。但是,在考慮擇業方向的時候,很多人都會有一個問題:PHP和Python哪個好找工作?這篇文章將從多個方…

    編程 2025-04-29
  • 進擊的漢字拆字窗

    進擊的漢字拆字窗是一款非常有用的中文工具,它可以幫助人們更好的學習漢字,了解漢字的含義,以及更好的了解漢字在中文中的運用和意義。 一、功能介紹 進擊的漢字拆字窗主要有以下幾個功能:…

    編程 2025-04-29
  • PHP怎麼接幣

    想要在自己的網站或應用中接受比特幣等加密貨幣的支付,就需要對該加密貨幣擁有一定的了解,並使用對應的API進行開發。本文將從多個方面詳細闡述如何使用PHP接受加密貨幣的支付。 一、環…

    編程 2025-04-29
  • Python中的位元組類數據

    Python作為其中一個最廣泛使用的編程語言之一,提供了多種數據類型來幫助開發者實現各種需求。在這些數據類型中,位元組類數據(bytes)是一個被廣泛使用的類型。本文將會從各個方面詳…

    編程 2025-04-28
  • 如何在Python中輸出漢字和數字

    本文將從多個方面詳細介紹如何在Python中輸出漢字和數字,並提供代碼示例。 一、輸出漢字 要在Python中輸出漢字,需要先確保Python默認編碼是utf-8,這可以通過在代碼…

    編程 2025-04-28
  • 使用PHP foreach遍歷有相同屬性的值

    本篇文章將介紹如何使用PHP foreach遍歷具有相同屬性的值,並給出相應的代碼示例。 一、基礎概念 在講解如何使用PHP foreach遍歷有相同屬性的值之前,我們需要先了解幾…

    編程 2025-04-28
  • python字元轉換成位元組的方法

    Python是一種很流行的編程語言,它支持多種數據類型的操作和轉換。在實際應用中,我們經常需要把字元轉換成位元組來進行網路傳輸或者文件讀取等操作。Python提供了很多方法可以完成這…

    編程 2025-04-28
  • PHP獲取301跳轉後的地址

    本文將為大家介紹如何使用PHP獲取301跳轉後的地址。301重定向是什麼呢?當我們訪問一個網頁A,但是它已經被遷移到了另一個地址B,此時若伺服器端做了301重定向,那麼你的瀏覽器在…

    編程 2025-04-27
  • Python中Turtle怎麼寫漢字

    Python中Turtle庫是一個在Python中用於繪製矢量圖形的庫。大多數場景下我們使用Turtle庫繪製的圖形是幾何圖形,但是在一些特殊的場景下,我們也可以使用Turtle庫…

    編程 2025-04-27
  • PHP登錄頁面代碼實現

    本文將從多個方面詳細闡述如何使用PHP編寫一個簡單的登錄頁面。 1. PHP登錄頁面基本架構 在PHP登錄頁面中,需要包含HTML表單,用戶在表單中輸入賬號密碼等信息,提交表單後服…

    編程 2025-04-27

發表回復

登錄後才能評論