问题标签 [greenplum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 200 亿行/月 - Hbase / Hive / Greenplum / 什么?
我想利用您的智慧为数据仓库系统找到正确的解决方案。这里有一些细节可以更好地理解问题:
数据以星型结构组织,具有一个 BIG 事实和约 15 个维度。
每月 20B 个事实行
10 个维度,百行(有点层次)
5 个维度,数千行
2 个维度,约 200K 行
2 个大维度,50M-100M 行
针对此数据库运行两个典型查询
dimq 中的顶级成员:
针对元组的措施:
问题:
- 执行此类查询的最佳平台是什么
- 需要什么样的硬件
它可以托管在哪里(EC2?)
(请暂时忽略导入和加载问题)
Tnx,
哈盖。
database - 错误:段连接失败:allocateWriterGang 试图返回一个坏的帮派。(cdbgang.c:2591)
在 Solaris 上使用 Greenplum 数据库版本 3.2.3。
步骤 1. 创建表。
步骤 2:从另一个表中插入数据。(这是普通的香草,没有分区,没有约束。它有 564,392,723 行。)
结果:
坏团伙的事情让整个节目陷入停顿,需要重新启动数据库才能再次清理。
在网上没有找到太多,用greenplum打开了一张帮助台票,我想我也会把它漂浮在这里。如果我在你之前得到一个解决方案,我会回来。
抱歉,没有足够的代表来标记“greenplum”。
sql - Greenplum:尚不支持从 segDB 执行 SQL 语句的函数
当我尝试从 SNE GP 版中我的一张表上的插入触发器集调用函数时,出现此错误:
这可能是什么原因?触发器 + 函数在同一个数据库中的另一个表上工作得很好。
提前致谢!
Rgds,基兰
sql - Greenplum vs PostgreSQL
支持和反对在 webapp ( ) 环境中使用Greenplum
而不是使用的论据是什么?PostgreSQL
django
我的直觉反应是更喜欢 PostgreSQL 的开源方法和庞大的知识库。
我的配置(尽管我很想听听任何其他配置)是一家中型企业,拥有 2 个 Web 服务器和(目前)2 个数据库服务器。
对比的领域是二进制data crunching
、节点数replication
和我个人最喜欢的:communitiy support
以及熟练的工程师支持。
使用 Greenplum 而不是 PostgreSQL 的优缺点是什么?
postgresql - 查看表的时间戳字段中的唯一日期的最快方法是什么?
我有一张有数十亿行的表。“记录”字段有每日分区,是“无时区的时间戳”。我想知道表中当前有哪些日期。我知道我可以做类似的事情:
理想情况下应该可以工作,但是对此的解释相当高,并且表明需要很长时间才能工作...如果这是我能做的最好的事情,我可以接受(并且我们可以密切关注数据)进去),但我想知道是否有更有效的方法来做到这一点,因为我每天都有分区?
python - 将数据从 DB2 DB 传输到 greenplum DB
我的公司已决定使用 [Greenplum] 实施数据集市,我的任务是弄清楚如何继续进行。从现有 [DB2] DB 传输到 Greenplum DB 的数据量大概是 2 TB。
我想知道:1)Greenplum DB 是否与 vanilla [PostgresSQL] 相同?(我在 Postgres AS 8.3 上工作过) 2)是否有任何(免费)工具可用于此任务(提取和导入) 3)我对 Python 有一些了解。在合理的时间内做到这一点是否可行,甚至容易?
我不知道该怎么做。任何建议、提示和建议都将受到欢迎。
jdbc - jdbc上的postgresql / greenplum参数绑定,为什么它认为它是一个列名?
我有一个看起来像这样的查询:
当参数 :p_name 设置为FOO时,我收到如下错误:
[42703] 错误:列“FOO”不存在
当我手动将其设置为包含单引号'FOO'时,它可以工作。
我试过填充转义的单引号。我已经尝试了 quote_* 函数。我试过用“@”“$”和“?” 参数类型。这不断出现。
编辑
尽我所能消除,我从 IntelliJ 的 sql 控制台尝试了以下操作
并在编辑框中添加“Foo”参数。在所有三种情况下,我都会遇到同样的问题。当我将“Foo”添加到编辑框时,我得到了我期望的结果。
我还使用了preparedStatement 和?而不是带有 :p1 的 callableStatement 并且也得到了相同的结果。
我究竟做错了什么?
编辑
从 JDBC URL 中删除“stringtype=unspecified”似乎可以解决问题。这就是为什么你不应该只是复制代码片段或其他人的代码并假设它对你有用。
database - 查询中未使用 Greenplum 索引
我创建了一个表 T ,它在列 C (btree index) 上创建了一个索引,但是当我运行选择查询时,该索引没有被使用。
前任:
这会按顺序搜索所有段,而不考虑我创建的索引。
我使用了以下标志
我错过了什么吗?请解释一下?
谢谢 Ganesh.R
copy - Greenplum COPY 不过滤重复条目
使用 COPY 命令将内容加载到绿色梅花表时出现问题。我所拥有的是三列表格,可以说 A , B , C 并且表格不应该包含重复的元素。所以我做了一个复合键,将上述三个
但是我用来加载表格的输入文件有重复的条目。我想要的只是 COPY 命令来过滤掉重复的元素并继续加载数据。但在我的情况下,只要 COPY 遇到重复条目,它就会中止加载。关于如何进行的任何线索?
谢谢
加内什
r - PostgreSQL 的 rodbc 字符编码错误
在使用 RODBC 从 R 连接到 GreenPlum PostgreSQL 数据库时,我遇到了一个以前从未遇到过的新错误。我使用 EMACS/ESS 和 RStudio 都遇到了错误,并且 RODBC 调用与过去一样工作。
编辑:刚刚尝试查询另一个表并得到了结果。所以我猜这不是 RODBC 问题,而是 PostgreSQL 表编码问题。