一个更接近我的问题被问到并在这里回答。
我的问题很简单:我需要在 R 中导入 .tsv 文件,但我不能,因为某些元素包含 \t,所以我收到如下错误:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 34 did not have 6 elements
一种方法是使用 gsub 来替换 \ts。但是这个文件很大,大约 11GB,做这个预处理对我的机器来说可能太多了。关于这里可能的捷径的任何想法?
一些上下文:最后我需要将整个数据集导入到 SQL 数据库中;我可以在不进行此转换的情况下做到这一点,但那时我会遇到同样的问题。