5

我有一些 UTF-8 的字幕文件。有时这些文件中有一些零星的多字节字符,这会导致某些应用程序出现问题。

如果某个文件包含任何多字节字符,我如何检查 linux(并可能找到这些)。

4

2 回答 2

3

您可以使用文件命令

chalet16$ echo test > a.txt
chalet16$ echo testก >  b.txt #One of Thai characters
chalet16$ file *.txt
a.txt: ASCII text
b.txt: UTF-8 Unicode text
于 2012-04-29T15:18:09.340 回答
2

您可以使用filechardet命令。

于 2012-04-29T15:16:13.630 回答