php字節數,php一個漢字幾個字節

本文目錄一覽:

php 幾個字節 函數

有兩個函數可以取PHP字符串長度

———————————————————————-

strlen — 獲取字符串長度

int strlen ( string $string )

返回給定的字符串 string 的長度。參數 string 需要計算長度的字符串。

返回值 成功則返回字符串 string 的長度;如果 string 為空,則返回 0。

———————————————————————-

mb_strlen — 獲取字符串的長度 (PHP 4 = 4.0.6, PHP 5)

mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )

獲取一個 string 的長度。

參數 str 要檢查長度的字符串。

encoding 參數為字符編碼。如果省略,則使用內部字符編碼。

返回值

返回具有 encoding 編碼的字符串 str 包含的字符數。 多字節的字符被計為 1。

如果給定的 encoding 無效則返回 FALSE。

特別要注意的是:

有關中文的問題。PHP內置的字符串長度函數strlen無法正確處理中文字符串,它得到的只是字符串所佔的字節數。對於GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對於UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字佔3個字節)。

採用mb_strlen函數可以較好地解決這個問題。mb_strlen的用法和strlen類似,只不過它有第二個可選參數用於指定字符編碼。例如得到UTF-8的字符串$str長度,可以用mb_strlen($str,’UTF-8′)。如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過mb_internal_encoding()函數得到。需要注意的是,mb_strlen並不是PHP核心函數,使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在並且沒有被注釋掉,否則會出現未定義函數的問題。

php如何判斷一個字所佔的字節數

GB 18030的雙字節部分完全採用了GBK的內碼系統。在此基礎上,做了四字節擴展,四個字節的編碼空間依次是:0x81到0xFE,0x30到0x39,0x81到0xFE,0x30到0x39。總共1,587,600個碼位

就是說你不能僅僅判斷一個字節,如果第二個字節的值是在0x30到0x39範圍里時,他就是4字節的漢字了

PHP如何獲取中文字符串長度 utf8

PHP對中文字符串的處理一直困擾於剛剛接觸PHP開發的新手程序員。下面簡要的剖析一下PHP對中文字符串長度的處理:

PHP自帶的函數如strlen()、mb_strlen()都是通過計算字符串所佔字節數來統計字符串長度的,一個英文字符佔1字節。例:

$enStr = ‘Hello,China!’;

echo strlen($enStr); // 輸出:12

而中文則不然,做中文網站一般會選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同,導致中文在gbk與utf-8編碼下所佔字節也有差異。

gbk編碼下每個中文字符所佔字節為2,例:

$zhStr = ‘您好,中國!’;

echo strlen($zhStr); // 輸出:12

utf-8編碼下每個中文字符所佔字節為3,例:

$zhStr = ‘您好,中國!’;

echo strlen($zhStr); // 輸出:18

那麼如何計算這組中文字符串的長度呢?有人可能會說gbk下獲取中文字符串長度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字符串並不老實,99%的情況會以中英混合的情況出現。

這是WordPress中的一段代碼,主要思想就是先用正則將字符串分解為個體單元,然後再計算單元的個數即字符串的長度,代碼如下(只能處理utf-8編碼下的字符串):

$zhStr = ‘您好,中國!’;

$str = ‘Hello,中國!’;

// 計算中文字符串長度

function utf8_strlen($string = null) {

// 將字符串分解為單元

preg_match_all(“/./us”, $string, $match);

// 返回單元個數

return count($match[0]);

}

echo utf8_strlen($zhStr); // 輸出:6

echo utf8_strlen($str); // 輸出:9

php 整型占幾個字節

據官方資料:

整型數的字長和平台有關,儘管通常最大值是大約二十億(32 位有符號)。 PHP 不支持無符號整數。Integer值的字長可以用常量PHP_INT_SIZE來表示,自 PHP 4.4.0 和 PHP 5.0.5後,最大值可以用常量PHP_INT_MAX來表示。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/243357.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 12:56
下一篇 2024-12-12 12:56

相關推薦

  • PHP和Python哪個好找工作?

    PHP和Python都是非常流行的編程語言,它們被廣泛應用於不同領域的開發中。但是,在考慮擇業方向的時候,很多人都會有一個問題:PHP和Python哪個好找工作?這篇文章將從多個方…

    編程 2025-04-29
  • 進擊的漢字拆字窗

    進擊的漢字拆字窗是一款非常有用的中文工具,它可以幫助人們更好的學習漢字,了解漢字的含義,以及更好的了解漢字在中文中的運用和意義。 一、功能介紹 進擊的漢字拆字窗主要有以下幾個功能:…

    編程 2025-04-29
  • PHP怎麼接幣

    想要在自己的網站或應用中接受比特幣等加密貨幣的支付,就需要對該加密貨幣擁有一定的了解,並使用對應的API進行開發。本文將從多個方面詳細闡述如何使用PHP接受加密貨幣的支付。 一、環…

    編程 2025-04-29
  • Python中的字節類數據

    Python作為其中一個最廣泛使用的編程語言之一,提供了多種數據類型來幫助開發者實現各種需求。在這些數據類型中,字節類數據(bytes)是一個被廣泛使用的類型。本文將會從各個方面詳…

    編程 2025-04-28
  • 如何在Python中輸出漢字和數字

    本文將從多個方面詳細介紹如何在Python中輸出漢字和數字,並提供代碼示例。 一、輸出漢字 要在Python中輸出漢字,需要先確保Python默認編碼是utf-8,這可以通過在代碼…

    編程 2025-04-28
  • 使用PHP foreach遍歷有相同屬性的值

    本篇文章將介紹如何使用PHP foreach遍歷具有相同屬性的值,並給出相應的代碼示例。 一、基礎概念 在講解如何使用PHP foreach遍歷有相同屬性的值之前,我們需要先了解幾…

    編程 2025-04-28
  • python字符轉換成字節的方法

    Python是一種很流行的編程語言,它支持多種數據類型的操作和轉換。在實際應用中,我們經常需要把字符轉換成字節來進行網絡傳輸或者文件讀取等操作。Python提供了很多方法可以完成這…

    編程 2025-04-28
  • PHP獲取301跳轉後的地址

    本文將為大家介紹如何使用PHP獲取301跳轉後的地址。301重定向是什麼呢?當我們訪問一個網頁A,但是它已經被遷移到了另一個地址B,此時若服務器端做了301重定向,那麼你的瀏覽器在…

    編程 2025-04-27
  • Python中Turtle怎麼寫漢字

    Python中Turtle庫是一個在Python中用於繪製矢量圖形的庫。大多數場景下我們使用Turtle庫繪製的圖形是幾何圖形,但是在一些特殊的場景下,我們也可以使用Turtle庫…

    編程 2025-04-27
  • PHP登錄頁面代碼實現

    本文將從多個方面詳細闡述如何使用PHP編寫一個簡單的登錄頁面。 1. PHP登錄頁面基本架構 在PHP登錄頁面中,需要包含HTML表單,用戶在表單中輸入賬號密碼等信息,提交表單後服…

    編程 2025-04-27

發表回復

登錄後才能評論