我有大量嵌套目录,其中包含 PHP、HTML 和 Javascript 文件,这些文件都应该编码为 UTF-8。但是,有人编辑了几个文件并使用 ISO-8859-1 编码保存了它们。不幸的是,它们都与 UTF-8 文件混在一起。
我想使用该iconv
工具将错误编码的文件转换为 UTF-8(如此处所述)。主要是,有效的 ISO-8859-1 但无效的 UTF-8 字符会出现问题。
我认为一个合适的起点是找到所有包含无效 UTF-8 的文件。有什么好方法可以做到这一点?
我意识到这不会捕获所有可能显示错误字符的情况。关于如何解决这个烂摊子的任何进一步提示?