6

给定一个已知为中文并以 UTF-8 编码的文本块,有没有办法确定它是简体还是繁体?

4

2 回答 2

4

我不知道这是否可行,但我会尝试使用 iconv 来查看它是否会在字符集之间正确转换,并将相同转换的结果与 //TRANSLIT 和 //IGNORE 进行比较。如果两个结果匹配,那么字符集转换没有遇到任何无法翻译的字符,所以你应该有一个匹配。

$test1 = iconv("UTF-8", "big5//TRANSLIT", $text);
$test2 = iconv("UTF-8", "big5//IGNORE", $text);
if ($test1 == $test2) {
   echo 'traditional';
} else {
   $test3 = iconv("UTF-8", "gb2312//TRANSLIT", $text);
   $test4 = iconv("UTF-8", "gb2312//IGNORE", $text);
   if ($test3 == $test4) {
      echo 'simplified';
   } else {
      echo 'Failed to match either traditional or simplified';
   }
}
于 2010-11-03T00:07:55.290 回答
2
于 2016-01-20T19:12:52.407 回答