0

这是我的函数,它使句子的第一个单词的第一个字符大写:

function sentenceCase($str)
{
    $cap = true;
    $ret = '';
    for ($x = 0; $x < strlen($str); $x++) {
        $letter = substr($str, $x, 1);
        if ($letter == "." || $letter == "!" || $letter == "?") {
            $cap = true;
        } elseif ($letter != " " && $cap == true) {
            $letter = strtoupper($letter);
            $cap = false;
        }
        $ret .= $letter;
    }
    return $ret;
}

它将“例句”转换为“例句”。问题是,它没有大写 UTF-8 字符。请参阅此示例

我究竟做错了什么?

4

1 回答 1

4

让您的代码具有 UTF-8 意识的最直接方法是在后者出现的三种情况下使用mbstring函数而不是普通的哑函数:

function sentenceCase($str)
{
    $cap = true;
    $ret = '';
    for ($x = 0; $x < mb_strlen($str); $x++) {      // mb_strlen instead
        $letter = mb_substr($str, $x, 1);           // mb_substr instead
        if ($letter == "." || $letter == "!" || $letter == "?") {
            $cap = true;
        } elseif ($letter != " " && $cap == true) {
            $letter = mb_strtoupper($letter);       // mb_strtoupper instead
            $cap = false;
        }
        $ret .= $letter;
    }
    return $ret;
}

然后,您可以配置mbstring为使用 UTF-8 字符串,然后就可以开始了:

mb_internal_encoding('UTF-8');
echo sentenceCase ("üias skdfnsknka");

奖金解决方案

特别是对于 UTF-8,您还可以使用正则表达式,这将减少代码:

$str = "üias skdfnsknka";
echo preg_replace_callback(
    '/((?:^|[!.?])\s*)(\p{Ll})/u',
    function($match) { return $match[1].mb_strtoupper($match[2], 'UTF-8'); },
    $str);
于 2013-09-17T08:43:11.103 回答