php - mb_substr 在剥离 UTF-8 文本时在末尾添加 3 个点（...），当文本为拉丁文时不添加它们

Question

我有这样的代码：

if(strlen($text)>=15)
$text=mb_substr($text, 0, 15, 'UTF-8');

它可以正常工作，但问题是，当文本是拉丁语（例如英语）时，当它剥离它时，它最终不会显示 3 个点。另一方面，当文本是需要 UTF-8 编码的其他语言时，它最后会添加 3 个点。

例子：

细胞是由什么组成的

被替换为

什么是细胞

另一方面：

で作られた细胞は何ですか

被替换为

で作られた细...

我错过了什么？

score 2 · Accepted Answer

发生这种情况是因为strlen()以二进制形式返回字符串的长度，即八位字节数。

因为 utf8 以与 iso-8859-1 相同的方式表示 ASCII，所以字符数和八位字节数之间没有区别。但是，对于 ASCII 以外的字符，例如亚洲字符，每个 utf8 字符最多可以占用三个八位字节。

因此，要正确确定您需要使用的字符数mb_strlen()。