6

我们有一个全部用大写字母的加拿大地址数据库,客户要求我们将第一个字母和“-”后面的字母转换为小写

所以我做了这个功能,但我遇到了法语重音字母的问题。

当文件和字符集为 ISO-88591 时它工作正常,但是当我尝试将其设为 UTF-8 时它不再工作了。

输入示例:'damien-claude élanger' 输出:Damien-Claude élanger

utf-8 中的 é 将变为 �

 function cap_letter($string) {
            $lower     = str_split("àáâçèéêë");
            $caps      = str_split("ÀÁÂÇÈÉÊË");
            $letters   = str_split(strtolower($string));

            foreach($letters as $code => $letter) {
                if($letter === '-' || $letter === ' ') {
                    $position = array_search($letters[$code+1],$lower);
                    if($position !== false) {
                        // test
                        echo $letters[$code+1] . ' == ' . $caps[$position] ; 
                        $letters[$code+1] = $caps[$position];
                    }
                    else {
                        $letters[$code+1] = mb_strtoupper($letters[$code+1]);
                    } 
                }
            }
            //return ucwords(implode($letters)) ;
            return implode($letters) ;
        }

我想到的另一个解决方案是: ucwords(strtolower($str)) 因为所有地址都已经大写,所以即使在应用 strtolower 之后 É 也会保持 É 。

但是我会遇到在 ex 里面有 É 的问题:XXXÉXXÉ

4

2 回答 2

12

尝试mb_*多字节字符的字符串函数。

echo mb_convert_case(mb_strtolower($str), MB_CASE_TITLE, "UTF-8");
于 2012-04-04T13:55:06.853 回答
1

我在西班牙语中有同样的问题,我创建了这个函数

function capitalize($string)
{
    if (mb_detect_encoding($string) === 'UTF-8') {
        $string = mb_convert_case(utf8_encode($string), MB_CASE_TITLE, 'UTF-8');
    } else {
        $string = mb_convert_case($string, MB_CASE_TITLE, 'UTF-8');
    }
    return $string;
}
于 2013-01-18T11:49:42.880 回答