- 1、怎麼用php判斷一個字元串是不是utf-8編碼
- 2、php 如何判斷字元是否是utf8編碼
- 3、PHP 檢測字元串的編碼是否是UTF
- 4、PHP完美判斷字元串是否為utf
PHP用MBString庫的函數
$e=mb_detect_encoding($text, array(‘UTF-8’, ‘GBK’));
switch($e){
case ‘UTF-8’ : //如果是utf8編碼
break;
case 『GBK』: //如果是gbk編碼
break
}
嚴格來說,不好判斷,但如下方法或許能給你應急處理。function is_utf8_encode($str, $flag=false){static $charset = null;if($charset == null){ //gbk中的漢字,但是滿足utf-8的編碼規範,對於這些漢字當做gbk字元處理$charstr = ‘隴摟簍擄鹵路脳脿謾貓茅錨矛鉚貌貿梅霉煤眉膩膿臎墨艅艌艒奴菐菒菕菙菛菢菤菧蓱傘藝藟藠藡藱螒螔螕螖螘螙螚螛螜螝螞螠螡螢螣螤巍危韋違桅圍唯惟偽尾緯未蔚味畏胃喂魏位渭謂尉慰蟺蟻蟽蟿蠀蠁蠂蠄蠅衼袗袘袙袚袛袝袞袟袠袡袣袥袦袧袨袩袪小孝校肖嘯笑效楔些歇蠍鞋協挾攜邪斜脅諧寫械卸蟹懈泄瀉謝屑薪芯鋅褉褋褌褍褎褏褑褔褕褖褗褘褜褝褞褟褢’;$charset = str_split($charstr, 2);$charset = array_flip($charset);}$pflag = true;$qflag = false;$len = strlen($str);
PHP用MBString庫的函數
$e=mb_detect_encoding($text, array(‘UTF-8’, ‘GBK’));
switch($e){
case ‘UTF-8’ : //如果是utf8編碼
break;
case 『GBK』: //如果是gbk編碼
break
}
完美判斷函數:
function is_utf8($gonten){if (preg_match(/^([.chr(228).-.chr(233).]{1}[.chr(128).-.chr(191).]{1}[.chr(128).-.chr(191).]{1}){1}/,$word) == true || preg_match(/([.chr(228).-.chr(233).]{1}[.chr(128).-.chr(191).]{1}[.chr(128).-.chr(191).]{1}){1}$/,$word) == true || preg_match(/([.chr(228).-.chr(233).]{1}[.chr(128).-.chr(191).]{1}[.chr(128).-.chr(191).]{1}){2,}/,$word) == true){return true;}else{return false;}}使用方法 is_utf8($gonten)就可以判斷字元串$gonten是否為utf-8編碼了。
網上流傳著這樣一個判斷函數,其實這函數判斷是不完整的,函數如下
function is_utf8($string) {
return preg_match(‘%^(?:
[\x09\x0A\x0D\x20-\x7E] # ASCII
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15
原創文章,作者:WQ3F5,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/126317.html