4

我有这样的代码:

if(strlen($text)>=15)
$text=mb_substr($text, 0, 15, 'UTF-8');

它可以正常工作,但问题是,当文本是拉丁语(例如英语)时,当它剥离它时,它最终不会显示 3 个点。另一方面,当文本是需要 UTF-8 编码的其他语言时,它最后会添加 3 个点。

例子:

细胞是由什么组成的

被替换为

什么是细胞

另一方面:

で作られた细胞は何ですか

被替换为

で作られた细...

我错过了什么?

4

1 回答 1

2

发生这种情况是因为strlen()以二进制形式返回字符串的长度,即八位字节数。

因为 utf8 以与 iso-8859-1 相同的方式表示 ASCII,所以字符数和八位字节数之间没有区别。但是,对于 ASCII 以外的字符,例如亚洲字符,每个 utf8 字符最多可以占用三个八位字节。

因此,要正确确定您需要使用的字符数mb_strlen()

于 2013-08-23T02:49:43.697 回答