我在https://groups.google.com/forum/#!topic/druid-user/SYWcqcr504k上问了我的问题, 但没有人帮我解决这个问题。
我正在处理大型数据集。在 2 种情况下的 topN 查询(按天计算的段粒度与按小时计算的段粒度)在 sam 上的“queryGranularity”按“小时”计算。
案例01:白天
"granularitySpec" : {
"type" : "uniform",
"segmentGranularity" : "day",
"queryGranularity" : "hour",
"intervals" : ["2016-08-22/2016-08-23"]
}
案例02:按小时
"granularitySpec" : {
"type" : "uniform",
"segmentGranularity" : "hour",
"queryGranularity" : "hour",
"intervals" : ["2016-08-22/2016-08-23"]
}
但是对 "segmentGranularity" : "day" 的查询时间比 "segmentGranularity" : "hour" 慢。谁能解释一下这个案子?为什么按天分段比按小时慢?在按天和按小时存储数据段之间,如何选择段类型?它如何影响我的查询?非常感谢 !