phputf8汉字个数,pythonutf8汉字占几个字节

本文目录一览:

PHP问题,我用PHP写了一个留言板,用的是UTF-8的编码,但是为什么输入一个汉字等于3个字母

汉字在UTF-8下是占3个字节

mb_strlen ( string str [, string encoding] )

获取的是有几个字符,将汉字都当成一个字符来计算

那数字和英文也都是一个字符来计算

mb_strlen($_POST[‘xx’])3

就是字符数少于3,也就是你自己说的意思:不管是数字还是汉字都要少于3个

PHP如何获取中文字符串长度 utf8

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

$enStr = ‘Hello,China!’;

echo strlen($enStr); // 输出:12

而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2,例:

$zhStr = ‘您好,中国!’;

echo strlen($zhStr); // 输出:12

utf-8编码下每个中文字符所占字节为3,例:

$zhStr = ‘您好,中国!’;

echo strlen($zhStr); // 输出:18

那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

$zhStr = ‘您好,中国!’;

$str = ‘Hello,中国!’;

// 计算中文字符串长度

function utf8_strlen($string = null) {

// 将字符串分解为单元

preg_match_all(“/./us”, $string, $match);

// 返回单元个数

return count($match[0]);

}

echo utf8_strlen($zhStr); // 输出:6

echo utf8_strlen($str); // 输出:9

php strlen utf8一个中文算3个字节吗?

utf8是变长编码, 不一定是3字节, 可能是2~3, 当然ASCII字符还是1字节.gbk也是变长编码, 非ASCII的2字节, ASCII还是1字节.这两个编码对于非ASCII字符, 都是多字节的, 并且多字节字符每个字节都是127的, 也就是负数(最高位是1).另外, PHP里的strlen不是依靠判断字符串结尾的, 因为PHP是脚本语言, 它的字符串和C++的string是一样的, 将存储的字节个数当作字符串长度.另外, PHP里想数数有多少个字节用strlen, 想数数有多少个字符, 用mb系列函数, 自己去了解一下.还有些需求, 比如字符串匹配查找之类的, gbk是存在双字节匹配问题的, 两个连续汉字的中间2个字节可能被误认为其他字符, 所以不能用strstr之类的字节匹配函数(PHP里是纯字节匹配的, 不关心), 但utf-8是可以的, 它不会有类似的冲突, 另外最好的做法当然还是用mb系列, 安全可靠, 而且还支持猜编码功能.

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/150645.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝的头像小蓝
上一篇 2024-11-09 02:13
下一篇 2024-11-09 02:13

相关推荐

  • Python列表中负数的个数

    Python列表是一个有序的集合,可以存储多个不同类型的元素。而负数是指小于0的整数。在Python列表中,我们想要找到负数的个数,可以通过以下几个方面进行实现。 一、使用循环遍历…

    编程 2025-04-29
  • 进击的汉字拆字窗

    进击的汉字拆字窗是一款非常有用的中文工具,它可以帮助人们更好的学习汉字,了解汉字的含义,以及更好的了解汉字在中文中的运用和意义。 一、功能介绍 进击的汉字拆字窗主要有以下几个功能:…

    编程 2025-04-29
  • Python计算中文字符个数

    本文将从多个方面对Python计算中文字符个数进行详细的阐述,包括字符串长度计算、正则表达式统计和模块使用方法等内容。 一、字符串长度计算 在Python中,计算字符串长度是非常容…

    编程 2025-04-29
  • Python中的字节类数据

    Python作为其中一个最广泛使用的编程语言之一,提供了多种数据类型来帮助开发者实现各种需求。在这些数据类型中,字节类数据(bytes)是一个被广泛使用的类型。本文将会从各个方面详…

    编程 2025-04-28
  • Python实现统计100以内能被7整除的数字个数

    本文将从以下几个方面详细阐述如何使用Python来实现统计100以内能被7整除的数字个数。具体内容包括: 一、range函数 Python中的range函数是用来生成一个数字序列的…

    编程 2025-04-28
  • Python计算个数函数用法介绍

    本文将对Python中计算个数的函数进行详细讲解,包括内置函数、常用模块和自定义函数,并给出完整的代码示例。 一、内置函数 Python内置了多个计算个数的函数,包括len()、c…

    编程 2025-04-28
  • Python3个数中的最大数的查找方法

    Python是一种高级编程语言,拥有易学易用、可移植性强、高效极速等优势,被广泛应用于数据分析、Web开发、人工智能等多个领域。在Python中,查找给定数列表中的最大数是一个非常…

    编程 2025-04-28
  • Python中一次输入两个数

    在Python中,一次输入两个数是一种常见的需求。本文将从多个方面阐述Python中一次输入两个数的实现方法。 一、input函数 Python中的input函数可以接受用户输入的…

    编程 2025-04-28
  • Python一次性输入10个数如何实现?

    Python提供了多种方法进行输入,可以手动逐个输入,也可以一次性输入多个数。在需要输入大量数据时,一次性输入十个数就非常方便。下面我们从多个方面来讲解如何一次性输入10个数。 一…

    编程 2025-04-28
  • 如何在Python中输出汉字和数字

    本文将从多个方面详细介绍如何在Python中输出汉字和数字,并提供代码示例。 一、输出汉字 要在Python中输出汉字,需要先确保Python默认编码是utf-8,这可以通过在代码…

    编程 2025-04-28

发表回复

登录后才能评论