php计算字符的个数和字节,php中一个汉字占几个字节

本文目录一览:

PHP字符串长度计算 – strlen()函数使用介绍

strlen()函数和mb_strlen()函数

在PHP中,函数strlen()返回字符串的长度。函数原型如下:

复制代码

代码如下:

int

strlen(string

string_input);

参数string_input为要处理的字符串。

strlen()函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为1。一个中午字符占两个字节,所以一个中午字符的长度是2。例如

复制代码

代码如下:

?php

echo

strlen(“”);

echo

strlen(“三知开发网”);

?

“echo

strlen(“”);”的运行结果:15

“echo

strlen(“三知开发网”);”的运行结果:15

这里有一个疑问,一个中文字符不是占2个字节吗?“三知开发网”,明明是五个汉字,运行的结果怎么会是15?

原因出在这里:strlen()计算时,对于一个UTF-8的中文字符,会把它当做长度为3来处理。当出现中英文混排的情况下,怎么准确的计算字符串的长度呢?这里,得引入另外一个函数mb_strlen()。mb_strlen()函数的用法与strlen()几乎一摸一样,只是多了一个指定字符集编码的参数。函数原型为:

复制代码

代码如下:

int

mb_strlen(string

string_input,

string

encode);

PHP内置的字符串长度函数strlen无法正确处理中文字符串,它得到的只是字符串所占的字节数。对于GB2312的中文编码,strlen得到的值是汉字个数的2倍,而对于UTF-8编码的中文,就是3倍的差异了(在UTF-8编码下,一个汉字占3个字节)。

因此,下面的代码能准确计算出中文字符串的长度:

复制代码

代码如下:

?php

$str

=

“三知sunchis开发网”;

echo

strlen($str).”br”;

//结果:22

echo

mb_strlen($str,”UTF8″).”br”;

//结果:12

$strlen

=

(strlen($str)+mb_strlen($str,”UTF8″))/2;

echo

$strlen;

//结果:17

?

原理分析:

strlen()计算时,对待UTF-8的中文字符长度是3,所以“三知sunchis开发网”的长度为5×3+7×1=22

在mb_strlen计算时,选定内码为UTF8,则会将一个中文字符当作长度1来计算,所以“三知sunchis开发网”长度为5×1+7×1=12

剩下的就是纯数学问题了,在此就不啰嗦了……

注意:对于mb_strlen($str,’UTF-8′),如果省略第二个参数,则会使用PHP的内部编码。内部编码可以通过mb_internal_encoding()函数得到。需要注意的是,mb_strlen并不是PHP核心函数,使用前需要确保在php.ini中加载了php_mbstring.dll,即确保“extension=php_mbstring.dll”这一行存在并且没有被注释掉,否则会出现未定义函数的问题。

php如何获取字符串长度,中文、符号、英文字母都算作一个?

一般情况下 有汉字的时候 是使用 mb_strlen 这个函数来计算字符长度

这个函数需要开启 mb_string扩展 默认都是不开启的

php strlen utf8一个中文算3个字节吗?

utf8是变长编码, 不一定是3字节, 可能是2~3, 当然ASCII字符还是1字节.gbk也是变长编码, 非ASCII的2字节, ASCII还是1字节.这两个编码对于非ASCII字符, 都是多字节的, 并且多字节字符每个字节都是127的, 也就是负数(最高位是1).另外, PHP里的strlen不是依靠判断字符串结尾的, 因为PHP是脚本语言, 它的字符串和C++的string是一样的, 将存储的字节个数当作字符串长度.另外, PHP里想数数有多少个字节用strlen, 想数数有多少个字符, 用mb系列函数, 自己去了解一下.还有些需求, 比如字符串匹配查找之类的, gbk是存在双字节匹配问题的, 两个连续汉字的中间2个字节可能被误认为其他字符, 所以不能用strstr之类的字节匹配函数(PHP里是纯字节匹配的, 不关心), 但utf-8是可以的, 它不会有类似的冲突, 另外最好的做法当然还是用mb系列, 安全可靠, 而且还支持猜编码功能.

原创文章,作者:DQKM,如若转载,请注明出处:https://www.506064.com/n/133842.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
DQKMDQKM
上一篇 2024-10-04 00:01
下一篇 2024-10-04 00:01

相关推荐

  • 英语年龄用连字符号(Hyphenation for English Age)

    英语年龄通常使用连字符号表示,比如 “five-year-old boy”。本文将从多个方面探讨英语年龄的连字符使用问题。 一、英语年龄的表达方式 英语中表…

    编程 2025-04-29
  • Python字符转列表指南

    Python是一个极为流行的脚本语言,在数据处理、数据分析、人工智能等领域广泛应用。在很多场景下需要将字符串转换为列表,以便于操作和处理,本篇文章将从多个方面对Python字符转列…

    编程 2025-04-29
  • Python学习笔记:去除字符串最后一个字符的方法

    本文将从多个方面详细阐述如何通过Python去除字符串最后一个字符,包括使用切片、pop()、删除、替换等方法来实现。 一、字符串切片 在Python中,可以通过字符串切片的方式来…

    编程 2025-04-29
  • 进击的汉字拆字窗

    进击的汉字拆字窗是一款非常有用的中文工具,它可以帮助人们更好的学习汉字,了解汉字的含义,以及更好的了解汉字在中文中的运用和意义。 一、功能介绍 进击的汉字拆字窗主要有以下几个功能:…

    编程 2025-04-29
  • Python计算中文字符个数

    本文将从多个方面对Python计算中文字符个数进行详细的阐述,包括字符串长度计算、正则表达式统计和模块使用方法等内容。 一、字符串长度计算 在Python中,计算字符串长度是非常容…

    编程 2025-04-29
  • Python中如何判断字符为数字

    判断字符是否为数字是Python编程中常见的需求,本文将从多个方面详细阐述如何使用Python进行字符判断。 一、isdigit()函数判断字符是否为数字 Python中可以使用i…

    编程 2025-04-29
  • Python中逗号算字符吗

    Python中逗号既可以作为分隔符,也可以作为一个表达式中的运算符。关于逗号作为分隔符是不会被算作字符的事情,这点大家都知道。本文主要就是阐述逗号作为运算符在表达式中是会被算作字符…

    编程 2025-04-28
  • Python中的字节类数据

    Python作为其中一个最广泛使用的编程语言之一,提供了多种数据类型来帮助开发者实现各种需求。在这些数据类型中,字节类数据(bytes)是一个被广泛使用的类型。本文将会从各个方面详…

    编程 2025-04-28
  • 从16进制转义到中文字符

    16进制转义是为了在不同的字符集、不同的编码下,能够保证特殊字符被正确的识别和渲染。本文将从多个方面对16进制转义做详细的阐述,让读者对其有更深入的了解。 一、转义实现 在Web开…

    编程 2025-04-28
  • 如何在Python中输出汉字和数字

    本文将从多个方面详细介绍如何在Python中输出汉字和数字,并提供代码示例。 一、输出汉字 要在Python中输出汉字,需要先确保Python默认编码是utf-8,这可以通过在代码…

    编程 2025-04-28

发表回复

登录后才能评论