4

如何为data.table对象选择正确的键?

这些考虑因素是否类似于 RDBMS 的考虑因素?我的第一个猜测是查看一些有关 RDBMS 的索引和键的文档。Google 提出了这个与 Oracle 相关的有用的 stackoverflow问题。

该答案中的注意事项是否适用于 data.tables?也许除了那些与 UPDATE、INSERT 或 DELETE 类型语句有关的语句之外?我猜我们的data.tables对象不会真正以这种方式使用。

我试图通过使用文档和示例来了解这些东西,但我还没有看到任何关于密钥选择的讨论。

PS:感谢@crayola 首先将我指向包裹data.table

4

1 回答 1

2

我不确定这是一个非常有用的答案,但既然你在问题中提到我,我还是会说我的想法。但请记住,我自己也是一个data.table新手。

我个人只在有明显好处时才使用键,例如合并数据表,或者似乎很明显这样做会加快速度(例如在变量上重复子集)。但据我所知,有时根本不需要定义键。这个包已经比data.frame没有钥匙快了。

于 2011-05-01T10:41:03.087 回答