我在 dbf 文件中有一个大型数据集,并希望将其导出到 csv 类型文件。多亏了SO已经成功地做到了。
但是,当我尝试将其导入 R(我工作的环境)时,它会将一些字符组合在一起,使某些行比它们应有的长得多,从而破坏了整个数据库。最后,每当我导入导出的 csv 文件时,我只得到一半的 db。认为主要问题是字符串字符中的引号,但quote=""
在 R 中指定并没有帮助(而且它通常有帮助)。
我已经搜索了有关在视觉 foxpro 中导出时如何处理引号的任何问题,但找不到答案。想对此进行测试,但我的计算机捕获错误,指出我没有足够的内存来完成我的操作(可能是由于数据库很大)。
任何帮助将不胜感激。我在从 dbf 导出到 R 时遇到了这个问题足够长的时间,搜索了我能做的一切,并拼命寻找一个简单的解决方案,如何将大型 dbf 导入我的 R 环境而没有任何错误。
(在 R 中:检查了导入文件是否有问题,实际上大多数列的 nchars 比应有的长得多,而行数减半。用read.csv("file.csv", quote="")
-> 读取数据库没有帮助。用data.table::fread()
返回错误读取
预期 sep (',') 但 '0' 在第 77980 行结束字段 88:
但根据 verbose=T,此函数读取正确的行数(read.csv 仅导入约 150 万行)
第一个数据行后的 eol 计数:2811729 最后一个 eol 和任何尾随空行减去 1,留下 2811728 个数据行