0

我有一个示例架构,例如:

id:1,date:2012-05-01,parent:p1
id:1,date:2012-05-01,parent:p2
id:1,date:2012-05-01,parent:p3
id:1,date:2012-05-02,parent:p1
id:1,date:2012-05-02,parent:p4

我想对“日期”进行范围查询,并知道每天有多少新/独特的父母发生。换句话说,我想看看随着时间的推移增加了多少新父母。对于给定的数据,输出应如下所示:

2012-04-31:0 (no parents existed an that time)
2012-05-01:3 (because three new parents occured at 2012-05-01: p1,p2,p3) 
2012-05-02:4 (which is 3 parents from 2012-05-01 and 1 new unique parent p4 occured at 2012-05-02 which gives a total of 4)
2012-05-03:4 (no new parent was added this day...)

这种查询甚至可以在 SOLR 中进行吗?

4

1 回答 1

2

是的,如果我正确理解您的问题,这应该相当简单。添加类似的东西

fq=date:[2012-05-05T00:00:00Z TO 2012-05-06T00:00:00Z]

到您的查询将获取日期在 5 月 5 日至 5 月 6 日之间的所有文档。确保以 ISO 8601 格式存储您的日期。

有关更多信息,请在此处查看日期示例:http ://wiki.apache.org/solr/SolrQuerySyntax

编辑:我现在更好地理解了您的问题-您正在寻找“组崩溃”。

尝试

&group=true&group.field=parent&group.limit=1

并计算返回的文档数量。

如果您希望它们具有每个日期的值,则需要按日期分面:

&facet=true&facet.field=date
于 2012-05-15T15:50:50.527 回答