我有一个content包含四列的集合;id, timestamp,locationID和authorID. 这是我的数据示例;在生产中,这是数千万行的长度。
id timestamp locationID authorID
1 2012-03-01 11:52:00 1 1
2 2012-03-16 19:56:00 1 2
3 2012-04-02 11:26:00 2 1
4 2012-04-22 11:52:00 2 3
5 2012-05-19 09:48:00 2 2
6 2012-05-30 07:12:00 2 1
7 2012-06-04 19:17:00 1 2
我想authorIDs收集content与timestamp特定locationID.
查询的正确值locationID = 2是:[ 1, 3 ],因为authorID1 和 3 最近在 '看到' locationID = 2,而authorID2 的最新内容在locationID1。
我当然可以每个 执行一个查询authorID,但在生产中,authorID数组的长度 > 100,000。这似乎非常低效(特别是当每个“子查询”都会达到这个数百万行content集合时),我正在寻找一种更好的方法来从我的数据集中出现这些数据,理想情况下速度足够快,可以在页面渲染上执行。