1

我正在使用此函数将某些标题截断为特定长度:

function truncateUTF8($str, $length, $breakWords = TRUE, $append = '...') {
    $strLength = mb_strlen($str);
    if ($strLength <= $length) {
       return $str;
    }
    if (!$breakWords) {
       while ($length < $strLength AND preg_match('/^\pL$/', mb_substr($str, $length, 1))) {
         $length++;
       }
    }
    return rtrim(mb_substr($str, 0, $length)) . $append;
}

来电:

echo truncateUTF8($str,94);

将在 UTF8 字符串上返回不同的字符串长度,看看这些字符串:

ORIGINAL STR
Mais de 100 carcaças de aviões de empresas falidas serão retiradas de aeroportos até o fim do ano
// 98 个字符

TRUNCATED STR
Mais de 100 carcaças de aviões de empresas falidas serão retiradas de aeroportos até o fim do...
// 94 chars - ok

ORIGINAL STR
Notícias Transbrasil – 28 – MP pod atuar em ações falimentares em que a lei não determina sua intervenção (STJ)
// 113 chars

TRUNCATED STR
Notícias Transbrasil – 28 – MP pode atuar em ações falimentares em que a lei não d...
// 83 chars

这里发生了什么?为什么第二个 str 被截断为 83 个字符而不是 94 个字符,就像第一个 str 一样?

谢谢。

4

1 回答 1

1

尝试一下

function truncateUTF8($str, $length, $breakWords = TRUE, $append = '...') {
    $strLength = mb_strlen($str);
    if ($strLength <= $length)
       return $str;
    return preg_replace('/(.{' . $length . '}).*/u', '$1' .  $append, $str);
}
于 2013-02-21T18:23:26.527 回答