postgresql - 是否有示例数据集来说明 cstore_fdw 的性能优势？

Question

我使用数据集浏览了 Citus 快速入门指南中的示例customer_reviews。它工作得很好，但是在常规 PostgreSQL 表中的相同数据集上的性能也相当不错。我怀疑这是因为数据集可能适合 RAM：我有一个 4 CPU Linux VM 和 8 GB RAM。

有人可以指出一个更好的数据集/查询示例来突出 cstore_fdw 的实用程序，传统的行存储在哪里遇到性能问题？

score 2 · Accepted Answer

我会通过以下方式即时生成数据：

node -e 'keys="pink penguins putter past potholes".split(" "), for (i=0; i<1000000; i++) console.log(JSON.stringify(keys.reduce((d,k) =>{ d[k]=Math.random(); return d; },{})))'

如果你知道你的 JSON blob 会是什么样子，你可以为它们编写一个模式并使用类似这个包的东西生成随机 blob

这个页面很好地描述了 JSON Schema。我不记得我最后使用了哪个随机 json 生成器，但只要它有效，你选择哪个可能并不重要。

我目前正在评估自己的 cstore。我已经有一个 JSON blob 的软管，所以我不需要再生成任何东西，但对于类似的情况，这是我以前做过的。

postgresql - 是否有示例数据集来说明 cstore_fdw 的性能优势？

1 回答 1

Related

Reference