我使用数据集浏览了 Citus 快速入门指南中的示例customer_reviews
。它工作得很好,但是在常规 PostgreSQL 表中的相同数据集上的性能也相当不错。我怀疑这是因为数据集可能适合 RAM:我有一个 4 CPU Linux VM 和 8 GB RAM。
有人可以指出一个更好的数据集/查询示例来突出 cstore_fdw 的实用程序,传统的行存储在哪里遇到性能问题?
我使用数据集浏览了 Citus 快速入门指南中的示例customer_reviews
。它工作得很好,但是在常规 PostgreSQL 表中的相同数据集上的性能也相当不错。我怀疑这是因为数据集可能适合 RAM:我有一个 4 CPU Linux VM 和 8 GB RAM。
有人可以指出一个更好的数据集/查询示例来突出 cstore_fdw 的实用程序,传统的行存储在哪里遇到性能问题?
我会通过以下方式即时生成数据:
node -e 'keys="pink penguins putter past potholes".split(" "), for (i=0; i<1000000; i++) console.log(JSON.stringify(keys.reduce((d,k) =>{ d[k]=Math.random(); return d; },{})))'
如果你知道你的 JSON blob 会是什么样子,你可以为它们编写一个模式并使用类似这个包的东西生成随机 blob
这个页面很好地描述了 JSON Schema。我不记得我最后使用了哪个随机 json 生成器,但只要它有效,你选择哪个可能并不重要。
我目前正在评估自己的 cstore。我已经有一个 JSON blob 的软管,所以我不需要再生成任何东西,但对于类似的情况,这是我以前做过的。