这是对此处提供的关于使用的答案的跟进sqldf()
https://stackoverflow.com/a/1820610
在我的特殊情况下,我有一个超过 1.1 亿行的制表符分隔文件。我想选择匹配 460 万个标签 ID 的行。
在以下代码中,标签 ID 位于tag.query
但是,虽然该示例适用于较小的查询,但它不能处理上述较大的示例:
sql.query <- paste('select * from f where v2 in (', tag.query, ')', sep='')
selected.df <- sqldf(sql.query, dbname = tempfile(), file.format = list(header = F, row.names = F, sep="\t", skip=line.where.header.is))
关于替代方法的任何建议?