#### strlen()函數和mb_strlen()函數
在PHP中,函數strlen()返回字符串的長度。函數原型如下:
~~~
int strlen(string string_input);
~~~
參數:string_input為要處理的字符串。
strlen()函數返回字符串所占的字節長度,一個英文字母、數字、各種符號均占一個字節,它們的長度均為1。一個中文字符占字節的大小取決于頁面編碼,所以一個中文字符的長度可能是2也可能是三。
UTF-8的中文字符串是三個字節
~~~
<?php
//編碼UTF-8
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','utf-8');
?>
~~~
輸出:25-9
GB2312的中文字符串是二個字節
~~~
<?php
//編碼GB2312
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','Gb2312');
?>
~~~
輸出:17-9
~~~
<?php
echo strlen("www.sunchis.com");
echo strlen("三知開發網");
?>
~~~
“echo strlen("www.sunchis.com");”的運行結果:15
“echo strlen("三知開發網");”的運行結果:15
這里有個疑問,一個中文字符不是占2個字節嗎?“三知開發網”,明明是五個漢字,運行的結果怎么會是15?
原因出在這里:strlen()計算時,對于一個UTF-8的中文字符,會把它當做長度為3來處理。當出現中英文混排的情況下,怎么準確的計算字符串的長度呢?
這里,得引入另外一個函數mb_strlen()。mb_strlen()函數的用法與strlen()幾乎一摸一樣,只是多了一個指定字符集編碼的參數。函數原型為:
~~~
int mb_strlen(string string_input, string encode);
~~~
PHP內置的字符串長度函數strlen無法正確處理中文字符串,它得到的只是字符串所占的字節數。對于GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對于UTF-8編碼的中文,就是3倍的差異了(在UTF-8編碼下,一個漢字占3個字節)。 而下面的代碼能準確計算出中文字符串的長度:
~~~
<?php
$str = "三知sunchis開發網";
echo strlen($str)."<br>"; //結果:22
echo mb_strlen($str,"UTF8")."<br>"; //結果:12
$strlen = (strlen($str)+mb_strlen($str,"UTF8"))/2;
echo $strlen; //結果:17
?>
~~~
原理分析:
strlen()計算時,對待UTF-8的中文字符長度是3,所以“三知sunchis開發網”的長度為5×3+7×1=22
在mb_strlen計算時,選定內碼為UTF8,則會將一個中文字符當作長度1來計算,所以“三知sunchis開發網”長度為5×1+7×1=12
注意:
對于mb_strlen($str,'UTF-8'),如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過mb_internal_encoding()函數得到。需要注意的是,mb_strlen并不是PHP核心函數,使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在并且沒有被注釋掉,否則會出現未定義函數的問題。
- 目錄
- 數據庫表
- 13.7.5.6 SHOW COLUMNS Syntax
- Mysql生成列
- 表注釋
- 默認字符集
- 索引
- 外鍵約束
- 數據類型
- NULL
- 查詢語句
- IF
- CASE
- FIND_IN_SET
- 更新語句
- 復制更新
- 截取更新
- 插入語句
- 從一張表查詢一個字段值插入另一個表中
- 統計函數
- COUNT
- 分組統計
- 日期時間字段按照日期分組
- GROUP_CONCAT
- 多字段關聯
- LENGTH
- mb_strlen()
- SUM
- 按周,按月,按日分組統計數據
- 日期時間
- MySQL日期時間數據類型使用總結
- 計算日期差
- 插入當前日期時間
- 時間比較
- datetime
- 日期時間取時間段
- 統計
- 整型unix時間戳
- 計算兩條相鄰記錄的時間差
- 日期時間-函數
- 常用函數
- CURDATE
- DATEDIFF
- DATE_ADD
- DATE_SUB
- EXTRACT
- NOW
- TO_DAYS
- UNIX_TIMESTAMP
- 作為時間比較
- FROM_UNIXTIME
- DATE_FORMAT
- TIMESTAMPDIFF
- 觸發器
- 存儲過程
- MySQL存儲過程的基本函數
- 分頁存儲過程
- 存儲過程教程
- 臨時表
- 備份表
- CRM
- 客戶關系表
- 通訊錄
- SQL函數
- ISNULL
- IFNULL
- SUBSTR
- 模糊查詢
- JSON
- Json函數
- Json數據類型
- 使用Json
- 使用navicat
- 虛擬列
- CRUD
- 索引設計
- 增加多字段索引
- 共享排他鎖