我有超过 5000 个文本文件在 Windows 中由我需要在 Mac OS X 机器上处理的 PDF 文件生成。我dos2unix
在所有这些上运行以更正换行符并将编码从 UTF-16LE 转换为 UTF-8。
在 4949 个案例中一切正常,但是对于 320 个文件,dos2unix 跳过执行,说它们是二进制文件。
这与file -c
我data
为 320 个跳过的文件和其他文件的文本相一致。然而,它们是目视检查的文本......
320怎么修?起初我怀疑这是 BOM 的存在,但它也出现在没有给出问题的文件上。
此外,数据和文本文件都以:
0000000 ff fe 3d 00 20 00 70 00 61 00 67 00 65 00 20 00
0000010 31 00 20 00 3d 00 0a 00 0d 00 0d 00 0a 00
有什么提示吗?提前致谢。