我有一个content
包含四列的集合;id
, timestamp
,locationID
和authorID
. 这是我的数据示例;在生产中,这是数千万行的长度。
id timestamp locationID authorID
1 2012-03-01 11:52:00 1 1
2 2012-03-16 19:56:00 1 2
3 2012-04-02 11:26:00 2 1
4 2012-04-22 11:52:00 2 3
5 2012-05-19 09:48:00 2 2
6 2012-05-30 07:12:00 2 1
7 2012-06-04 19:17:00 1 2
我想authorIDs
收集content
与timestamp
特定locationID
.
查询的正确值locationID = 2
是:[ 1, 3 ]
,因为authorID
1 和 3 最近在 '看到' locationID = 2
,而authorID
2 的最新内容在locationID
1。
我当然可以每个 执行一个查询authorID
,但在生产中,authorID
数组的长度 > 100,000。这似乎非常低效(特别是当每个“子查询”都会达到这个数百万行content
集合时),我正在寻找一种更好的方法来从我的数据集中出现这些数据,理想情况下速度足够快,可以在页面渲染上执行。