1

我正在尝试将一些编码为 EBCDIC 的大型机数据读入 R,但不知所措。我想避免使用外部程序来转换文件,因为我在公司环境中操作。

您可以在此处找到示例文件,包括 ASCII 和 EBCDIC 版本。请注意,文件的 EBCDIC 版本中没有换行符——相反,我将手动指定每行的宽度。R 在我的环境中有可用的 IBM500 编码,这应该是这些文件的正确编码。

但是,当我运行以下命令时,R 似乎完全失败了。

layout <- read.fwf("EBCDIC_LAYOUT", widths = c(80), fileEncoding='ibm500')
data   <- read.fwf("EBCDIC_ZIPCODE", widths = c(32), fileEncoding='ibm500')

我可以从这里去哪里?

相关——我希望使用的一些文件会相当大(1 GB 左右)。最好,我想要一个可以合理扩展的解决方案。(我试过像 LaF 这样的包,但他们没有选择编码的选项。)

非常感谢!

4

0 回答 0