在 R 中,我试图读取大约 42,900 行的基本 CSV 文件(由 Unix 的 wc -l 确认)。相关代码是
vecs <- read.csv("feature_vectors.txt", header=FALSE, nrows=50000)
其中 nrows 稍微高估了,因为为什么不呢。然而,
>> dim(vecs)
[1] 16853 5
表明生成的数据框有大约 17,000 行。这是内存问题吗?每行由一个~30 个字符的哈希码、一个~30 个字符串和3 个整数组成,所以文件的总大小只有4MB 左右。
如果它是相关的,我还应该注意到很多行都缺少字段。
谢谢你的帮助!