给定一个已知为中文并以 UTF-8 编码的文本块,有没有办法确定它是简体还是繁体?
问问题
4860 次
2 回答
4
我不知道这是否可行,但我会尝试使用 iconv 来查看它是否会在字符集之间正确转换,并将相同转换的结果与 //TRANSLIT 和 //IGNORE 进行比较。如果两个结果匹配,那么字符集转换没有遇到任何无法翻译的字符,所以你应该有一个匹配。
$test1 = iconv("UTF-8", "big5//TRANSLIT", $text);
$test2 = iconv("UTF-8", "big5//IGNORE", $text);
if ($test1 == $test2) {
echo 'traditional';
} else {
$test3 = iconv("UTF-8", "gb2312//TRANSLIT", $text);
$test4 = iconv("UTF-8", "gb2312//IGNORE", $text);
if ($test3 == $test4) {
echo 'simplified';
} else {
echo 'Failed to match either traditional or simplified';
}
}
于 2010-11-03T00:07:55.290 回答
2
于 2016-01-20T19:12:52.407 回答