本文目錄一覽:
- 1、PHP符串處理函數
- 2、PHP字符串長度計算 – strlen()函數使用介紹
- 3、php如何獲取中文字符長度,一個中文字符算一個
- 4、php哪個函數能取得字符串長度
- 5、用PHP統計字符串長度?
PHP符串處理函數
PHP5字符串處理函數
addcslashes — 為字符串裏面的部分字符添加反斜線轉義字符
addslashes — 用指定的方式對字符串裏面的字符進行轉義
bin2hex — 將二進制數據轉換成十六進制表示
chop — rtrim() 的別名函數
chr — 返回一個字符的ASCII碼
chunk_split — 按一定的字符長度將字符串分割成小塊
convert_cyr_string — 將斯拉夫語字符轉換為別的字符
convert_uudecode — 解密一個字符串
convert_uuencode — 加密一個字符串
count_chars — 返回一個字符串裏面的字符使用信息
crc32 — 計算一個字符串的crc32多項式
crypt — 單向散列加密函數
echo — 用以顯示一些內容
explode — 將一個字符串用分割符轉變為一數組形式
fprintf — 按照要求對數據進行返回,並直接寫入文檔流
get_html_translation_table — 返回可以轉換的HTML實體
hebrev — 將Hebrew編碼的字符串轉換為可視的文本
hebrevc — 將Hebrew編碼的字符串轉換為可視的文本
html_entity_decode — htmlentities ()函數的反函數,將HTML實體轉換為字符
htmlentities — 將字符串中一些字符轉換為HTML實體
htmlspecialchars_decode — htmlspecialchars()函數的反函數,將HTML實體轉換為字符
htmlspecialchars — 將字符串中一些字符轉換為HTML實體
implode — 將數組用特定的分割符轉變為字符串
join — 將數組轉變為字符串,implode()函數的別名
levenshtein — 計算兩個詞的差別大小
localeconv — 獲取數字相關的格式定義
ltrim — 去除字符串左側的空白或者指定的字符
md5_file — 將一個文件進行MD5算法加密
md5 — 將一個字符串進行MD5算法加密
metaphone — 判斷一個字符串的發音規則
money_format — 按照參數對數字進行格式化的輸出
nl_langinfo — 查詢語言和本地信息
nl2br — 將字符串中的換行符「n」替換成「
」
number_format — 按照參數對數字進行格式化的輸出
ord — 將一個ASCII碼轉換為一個字符
parse_str — 把一定格式的字符串轉變為變量和值
print — 用以輸出一個單獨的值
printf — 按照要求對數據進行顯示
quoted_printable_decode — 將一個字符串加密為一個8位的二進制字符串
quotemeta — 對若干個特定字符進行轉義
rtrim — 去除字符串右側的空白或者指定的字符
setlocale — 設置關於數字,日期等等的本地格式
sha1_file — 將一個文件進行SHA1算法加密
sha1 — 將一個字符串進行SHA1算法加密
similar_text — 比較兩個字符串,返回系統認為的相似字符個數
soundex — 判斷一個字符串的發音規則
sprintf — 按照要求對數據進行返回,但是不輸出
sscanf — 可以對字符串進行格式化
str_ireplace — 像str_replace()函數一樣匹配和替換字符串,但是不區分大小寫
str_pad — 對字符串進行兩側的補白
str_repeat — 對字符串進行重複組合
str_replace — 匹配和替換字符串
str_rot13 — 將字符串進行ROT13加密處理
str_shuffle — 對一個字符串裏面的字符進行隨機排序
str_split — 將一個字符串按照字符間距分割為一個數組
str_word_count — 獲取字符串裏面的英文單詞信息
strcasecmp — 對字符串進行大小比較,不區分大小寫
strchr — 通過比較返回一個字符串的部分strstr()函數的別名
strcmp — 對字符串進行大小比較
strcoll – 根據本地設置對字符串進行大小比較
strcspn — 返回字符連續非匹配長度的值
strip_tags — 去除一個字符串裏面的HTML和PHP代碼
stripcslashes — 反轉義addcslashes()函數轉義處理過的字符串
stripos — 查找並返回首個匹配項的位置,匹配不區分大小寫
stripslashes — 反轉義addslashes()函數轉義處理過的字符串
stristr — 通過比較返回一個字符串的部分,比較時不區分大小寫
strlen — 獲取一個字符串的編碼長度
strnatcasecmp — 使用自然排序法對字符串進行大小比較,不區分大小寫
strnatcmp — 使用自然排序法對字符串進行大小比較
strncasecmp — 對字符串的前N個字符進行大小比較,不區分大小寫
strncmp — 對字符串的前N個字符進行大小比較
strpbrk — 通過比較返回一個字符串的部分
strpos — 查找並返回首個匹配項的位置
strrchr — 通過從後往前比較返回一個字符串的.部分
strrev — 將字符串裏面的所有字母反向排列
strripos — 從後往前查找並返回首個匹配項的位置,匹配不區分大小寫
strrpos – 從後往前查找並返回首個匹配項的位置
strspn — 匹配並返回字符連續出現長度的值
strstr — 通過比較返回一個字符串的部分
strtok — 用指定的若干個字符來分割字符串
strtolower — 將字符串轉變為小寫
strtoupper –將字符串轉變為大寫
strtr — 對字符串比較替換
substr_compare — 對字符串進行截取後的比較
substr_count — 計算字符串中某字符段的出現次數
substr_replace — 對字符串中的部分字符進行替換
substr — 對字符串進行截取
trim — 去除字符串兩邊的空白或者指定的字符
ucfirst — 將所給字符串的第一個字母轉換為大寫
ucwords — 將所給字符串的每一個英文單詞的第一個字母變成大寫
vfprintf — 按照要求對數據進行返回,並直接寫入文檔流
vprintf — 按照要求對數據進行顯示
vsprintf — 按照要求對數據進行返回,但是不輸出
wordwrap — 按照一定的字符長度分割字符串
strtolower()函數把所有字符變成小寫,strtoupper()函數把所有字符變成大寫,ucfirst()函數將所給字符串的第一個字母轉換為大寫,ucwords()函數將所給字符串的每一個英文單詞的第一個字母變成大寫。ucfirst()只處理字符串的首個字符,ucwords()只處理每個單詞的首字母(以空格來界定是否是單詞,「today!Hi」、「today.Hi」 會被認為是一個單詞),對於其餘字母的大小寫狀態並不改變。 ;
PHP字符串長度計算 – strlen()函數使用介紹
strlen()函數和mb_strlen()函數
在PHP中,函數strlen()返回字符串的長度。函數原型如下:
複製代碼
代碼如下:
int
strlen(string
string_input);
參數string_input為要處理的字符串。
strlen()函數返回字符串所佔的位元組長度,一個英文字母、數字、各種符號均佔一個位元組,它們的長度均為1。一個中午字符佔兩個位元組,所以一個中午字符的長度是2。例如
複製代碼
代碼如下:
?php
echo
strlen(“”);
echo
strlen(“三知開發網”);
?
「echo
strlen(“”);」的運行結果:15
「echo
strlen(“三知開發網”);」的運行結果:15
這裡有一個疑問,一個中文字符不是佔2個位元組嗎?「三知開發網」,明明是五個漢字,運行的結果怎麼會是15?
原因出在這裡:strlen()計算時,對於一個UTF-8的中文字符,會把它當做長度為3來處理。當出現中英文混排的情況下,怎麼準確的計算字符串的長度呢?這裡,得引入另外一個函數mb_strlen()。mb_strlen()函數的用法與strlen()幾乎一摸一樣,只是多了一個指定字符集編碼的參數。函數原型為:
複製代碼
代碼如下:
int
mb_strlen(string
string_input,
string
encode);
PHP內置的字符串長度函數strlen無法正確處理中文字符串,它得到的只是字符串所佔的位元組數。對於GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對於UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字佔3個位元組)。
因此,下面的代碼能準確計算出中文字符串的長度:
複製代碼
代碼如下:
?php
$str
=
“三知sunchis開發網”;
echo
strlen($str).”br”;
//結果:22
echo
mb_strlen($str,”UTF8″).”br”;
//結果:12
$strlen
=
(strlen($str)+mb_strlen($str,”UTF8″))/2;
echo
$strlen;
//結果:17
?
原理分析:
strlen()計算時,對待UTF-8的中文字符長度是3,所以「三知sunchis開發網」的長度為5×3+7×1=22
在mb_strlen計算時,選定內碼為UTF8,則會將一個中文字符當作長度1來計算,所以「三知sunchis開發網」長度為5×1+7×1=12
剩下的就是純數學問題了,在此就不啰嗦了……
注意:對於mb_strlen($str,’UTF-8′),如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過mb_internal_encoding()函數得到。需要注意的是,mb_strlen並不是PHP核心函數,使用前需要確保在php.ini中加載了php_mbstring.dll,即確保「extension=php_mbstring.dll」這一行存在並且沒有被注釋掉,否則會出現未定義函數的問題。
php如何獲取中文字符長度,一個中文字符算一個
在PHP中專門的mb_substr和mb_strlen函數,可以對中文進行截取和計算長度,但是,由於這些函數並非PHP的核心函數,所以,它們常常有可能沒有開啟。要在php.ini中開啟即可。獲取長度實例:1 ,utf-8環境下使用
header(‘Content-type:text/html;charset=utf-8’);
/**
* 可以統計中文字符串長度的函數
* @param $str 要計算長度的字符串
* @param $type 計算長度類型,0(默認)表示一個中文算一個字符,1表示一個中文算兩個字符
*
*/
function abslength($str)
{
if(empty($str)){
return 0;
}
if(function_exists(‘mb_strlen’)){
return mb_strlen($str,’utf-8′);
}
else {
preg_match_all(“/./u”, $str, $ar);
return count($ar[0]);
}
}
$str = ‘我們都是中國人啊,ye!’;
$len = abslength($str);
var_dump($len); //return 12
$len = abslength($str,’1′);
echo ‘br /’.$len; //return 22
/*
utf-8編碼下截取中文字符串,參數可以參照substr函數
@param $str 要進行截取的字符串
@param $start 要進行截取的開始位置,負數為反向截取
@param $end 要進行截取的長度
*/
function utf8_substr($str,$start=0) {
if(empty($str)){
return false;
}
if (function_exists(‘mb_substr’)){
if(func_num_args() = 3) {
$end = func_get_arg(2);
return mb_substr($str,$start,$end,’utf-8′);
}
else {
mb_internal_encoding(“UTF-8”);
return mb_substr($str,$start);
}
}
else {
$null = “”;
preg_match_all(“/./u”, $str, $ar);
if(func_num_args() = 3) {
$end = func_get_arg(2);
return join($null, array_slice($ar[0],$start,$end));
}
else {
return join($null, array_slice($ar[0],$start));
}
}
}
$str2 = ‘wo要截取zhongwen’;
echo ‘br /’;
echo utf8_substr($str2,0,-4); //return wo要截取zhon
2,支持gb2312,gbk,utf-8,big5 中文截取方法
/*
* 中文截取,支持gb2312,gbk,utf-8,big5
*
* @param string $str 要截取的字串
* @param int $start 截取起始位置
* @param int $length 截取長度
* @param string $charset utf-8|gb2312|gbk|big5 編碼
* @param $suffix 是否加尾綴
*/
public function csubstr($str, $start=0, $length, $charset=”utf-8″, $suffix=true)
{
if(function_exists(“mb_substr”))
{
if(mb_strlen($str, $charset) = $length) return $str;
$slice = mb_substr($str, $start, $length, $charset);
}
else
{
$re[‘utf-8’] = “/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/”;
$re[‘gb2312’] = “/[\x01-\x7f]|[\xb0-\xf7][\xa0-\xfe]/”;
$re[‘gbk’] = “/[\x01-\x7f]|[\x81-\xfe][\x40-\xfe]/”;
$re[‘big5’] = “/[\x01-\x7f]|[\x81-\xfe]([\x40-\x7e]|\xa1-\xfe])/”;
preg_match_all($re[$charset], $str, $match);
if(count($match[0]) = $length) return $str;
$slice = join(“”,array_slice($match[0], $start, $length));
}
if($suffix) return $slice.”…”;
return $slice;
}
php哪個函數能取得字符串長度
PHP對中文字符串的處理一直困擾於剛剛接觸PHP開發的新手程序員。下面簡要的剖析一下PHP對中文字符串長度的處理:
PHP自帶的函數如strlen()、mb_strlen()都是通過計算字符串所佔位元組數來統計字符串長度的,一個英文字符佔1位元組。
用PHP統計字符串長度?
PHP 計算字符串長度代碼示例如下,具體邏輯在代碼中。
?php
//統計字符串長度,適用中文,字母,數字混編
function get_strlength($str) {
//強字符串統一轉換為utf-8格式
$encode = mb_detect_encoding( $str, array(‘ASCII’,’UTF-8′,’GB2312′,’GBK’));
if (!$encode ==’UTF-8′){
$str = iconv(‘UTF-8’,$encode,$str);
}
//初始化字符串長度
$count = 0;
//循環統計
for($i = 0; $i strlen($str); $i++){
//獲取字符串首字母對應的ASCII值
$value = ord($str[$i]);
if($value 127) {
$count++;
if($value = 192 $value = 223){
$i++;
}elseif($value = 224 $value = 239){
$i = $i + 2;
}elseif($value = 240 $value = 247){
$i = $i + 3;
}else{
die(‘字符串異常!!’);
}
}
$count++;
}
return $count;
}
//測試
echo get_strlength(“中國人2015年的gdp為:6666”);
//25
?
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/248899.html