问题标签 [greenplum]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5058 浏览

database - 在 Greenplum (PostgreSQL) 中格式化外部表

我想使用外部表将一个普通文件加载到 Greenplum 数据库中。我可以为时间戳/日期/时间字段指定输入格式吗?(如果你知道 PostgreSQL 的答案,也请回复)

例如,对于 Oracle,我可以使用 DATE_FORMAT DATE MASK 'YYYYMMDD' 来告诉如何解析日期。对于 Netezza,我可以指定 DATESTYLE 'YMD'。对于 Greenplum,我找不到答案。我可以将字段描述为 char,然后在加载期间解析它们,但这是一个丑陋的解决方法。

这是我的暂定代码:

0 投票
3 回答
609 浏览

database - Greenplum 中的并行数据加载

Greenplum 说它具有并行数据加载功能。我对它的工作原理有疑问。请务必向我解释。我知道记录是并行读取的,但我不明白并行写入是如何完成的。并行写入是在同一个数据库上完成还是在不同的数据库(段)上完成?请解释一下。谢谢

0 投票
1 回答
364 浏览

python - 一个查询中打开了多少个plpython执行环境?

postgres(和greenplum)中的用户定义函数是独立运行的吗?当我使用 plpythonu 用户定义函数进行查询时,打开了多少个执行环境?运行查询时是否有任何共享的 python 解释器状态?

假设我有一个 plpython 用户定义函数:

对于一个表create table files (name varchar, path varchar)和对该表的查询,如下所示:

每次执行我的 plpython 函数都会产生一个新的 python 环境吗?在 MPP 数据库中,我可以假设 postgres 的行为在每个段之间重复,而段之间没有共享状态吗?

0 投票
1 回答
1068 浏览

sql-server - SSIS 数据传输添加字符(SQL Server 到 Postgres)

我创建了一个 SSIS 包,它从 SQL Server 数据库中取出地理数据并将其复制到GreenplumPostgres 数据库中的几何列。

由于PGNP驱动程序在以正常方式尝试时出现奇怪错误,我正在以迂回的方式进行操作。所以我正在做的是GeogColumn.STAsText()在 SQL Server 源上使用并将其插入到数据库中的文本列中,然后运行一个任务,使用新插入的文本Greenplum更新表中的几何列,例如应该看起来像.GreenplumPOLYGON(-85 42, -86 43)

问题是\\000在每个字符之后添加,然后更新将不起作用。这是它的样子:

来源 在此处输入图像描述

目的地

在此处输入图像描述

我该如何阻止这种情况发生?

0 投票
2 回答
2505 浏览

sas - SAS Proc SQL 将常量添加到变量

我有一个带有数字变量tofrom和的 SAS 数据集weight。一些观测值的值为 0 weight。我需要所有的weight值都是正数,所以我希望简单地将所有weight值加 1。

如何使用 Proc SQL 做到这一点?

我尝试了以下方法,但它不起作用:

错误是:

此外,mylib指的是 Greenplum 设备。这可能是问题...

0 投票
1 回答
267 浏览

mule - 如何将记录从 Mule 插入 GreenPlum 数据库?

这个问题是How to read CSV file and insert data into PostgreSQL using Mule ESB, Mule Studio的一个变体。早些时候我们有 PostgreSQL,但现在它已更改为 GreenPlum 数据库。但是 PostgreSQL 在 Mule Studio 中有原生支持,但在 GreenPlum 数据库中没有。

我该怎么做这个插入?

0 投票
2 回答
390 浏览

sql - 根据小时过滤窗口功能

我想使用两个不同(但相似)的窗口函数来计算两个值 SUMCOUNTon is_active over user_id+item,只到行的时间 - 负 1 小时。我的直觉是使用 ROWSUNBOUNDED PRECEDING但这样我就不能随着时间的推移进行过滤

但是,这没有考虑“1 小时前”间隔因素

考虑以下数据:

我希望得到以下结果:“值 1”是 SUM(is_active),“值 2”是 COUNT(1):

我正在使用基于 Postgresql 8.2.15 的 Greenplum 4.21

提前致谢!吉利比

0 投票
2 回答
310 浏览

kerberos - Greenplum 是否支持其节点之间的 Kerberos 身份验证?

我需要“kerberize”我们的 Greenplum 集群。其中一个方面是我应该对 GP 主机和它的分段主机之间的接口进行 kerberize 处理。我无法确定这是否受支持。

我已经看到了 posgresql.conf 文件中的参数(krb_server_keyfile 和 krb_srvname)并尝试设置这些参数,但它似乎不起作用(Greenplum 仍然有效,它只是没有显示连接是 kerberized)。

我用 hadoop 做到了这一点,它非常简单,但是,再一次,无法弄清楚如何在 GP 中做到这一点,或者是否有可能。有任何想法吗?

谢谢

0 投票
1 回答
1030 浏览

postgresql - 从 PostgreSQL 中的文件向表中插入数据,不带双引号

我有一个包含一些数据的文件,我需要在表格中插入这些数据。我正在使用gpfdist-external table - table加载文件。

我能够在表中加载数据,但我的问题是输入文件中的字段用双引号括起来,如“Emp Name”,同样会进入数据库。我不希望这些双引号进入数据库。只有那些引号内的值应该去。

我在某个地方找到了这个 [ENCLOSED BY '"'] 但它在 greenplum 中不起作用。请告诉我我可以在我的外部表中更改的位置,以便只有双引号内的值应该进入数据库而不是双引号。

谢谢和问候,阳光

0 投票
2 回答
2224 浏览

sql - 在 Greenplum 中实现公用表表达式

有没有办法强制Greenplum PostgreSQL在一个WITH子句中实现子查询,就像Oracle中MATERIALIZEINLINE 优化器提示在下面所做的那样?

我已经搜索了一段时间,只是在 Oracle 中找到了这个功能。

我知道我可以使用CREATE TABLE AS,但是我有几个类似的查询,迫使我在每次查询后删除临时表,这非常不方便,而且可能效率低下。

更新:我测试了下表:

我正在使用 Greenplum Postgresql 8.2