我在 Infobright 中有一个包含大约 4000 万行的事实表。在该表上运行查询(如下所示)需要 10 多分钟。
SELECT pat_key,
COUNT(c_id)
FROM my_fact_table
GROUP BY pat_key
ORDER BY COUNT(c_id) DESC
LIMIT 50;
Duration/Fetch = 334.528 sec / 0.094 sec
任何想法为什么以及如何调整这个?
顺便说一句,硬件规格是 AWS m1.large。所以抛开网络延迟不谈,这仍然是一个重要的时间间隔。