3

我在使用 160.000 行文件时遇到了一些问题,该文件是通过从 xlsx 文件导出生成的,它具有 .txt 扩展名,但我担心它已被导出为类似 DOS 的文件,位于每行的末尾都有 DOS 换行符。我正在使用用 java 编写的解析器,在 Ubuntu 环境中运行,当我运行解析器时得到了这个(我无法编辑,因为它是 jar 的一部分,我无法访问源代码),我得到 NumberFormatException 哪里一个数字是预期的,我的行结束是这样的:

4449

但解析器将其视为

For input string: "4449&#xd;"<

您对此有解决方案吗?我再次无法自己访问解析器,我将不得不“在我的 Ubuntu 机器上”编辑文件并删除那些行尾。

4

2 回答 2

5

尝试dos2unix对该文件使用该命令。那应该修复行终止符。

> dos2unix winfile.txt unixfile.txt

参考:
dos2unix 手册页

于 2013-06-20T19:08:02.633 回答
0

解析器正在寻找&#xd;,这是一个 Windows 回车;但是,它无法解析这些字符。转到文件并运行快速命令tr -d '\15\32' < winfile.txt > unixfile.txt

参考: http: //kb.iu.edu/data/acux.html

于 2013-06-20T19:13:05.600 回答