问题标签 [greenplum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 在 Greenplum (PostgreSQL) 中格式化外部表
我想使用外部表将一个普通文件加载到 Greenplum 数据库中。我可以为时间戳/日期/时间字段指定输入格式吗?(如果你知道 PostgreSQL 的答案,也请回复)
例如,对于 Oracle,我可以使用 DATE_FORMAT DATE MASK 'YYYYMMDD' 来告诉如何解析日期。对于 Netezza,我可以指定 DATESTYLE 'YMD'。对于 Greenplum,我找不到答案。我可以将字段描述为 char,然后在加载期间解析它们,但这是一个丑陋的解决方法。
这是我的暂定代码:
database - Greenplum 中的并行数据加载
Greenplum 说它具有并行数据加载功能。我对它的工作原理有疑问。请务必向我解释。我知道记录是并行读取的,但我不明白并行写入是如何完成的。并行写入是在同一个数据库上完成还是在不同的数据库(段)上完成?请解释一下。谢谢
python - 一个查询中打开了多少个plpython执行环境?
postgres(和greenplum)中的用户定义函数是独立运行的吗?当我使用 plpythonu 用户定义函数进行查询时,打开了多少个执行环境?运行查询时是否有任何共享的 python 解释器状态?
假设我有一个 plpython 用户定义函数:
对于一个表create table files (name varchar, path varchar)
和对该表的查询,如下所示:
每次执行我的 plpython 函数都会产生一个新的 python 环境吗?在 MPP 数据库中,我可以假设 postgres 的行为在每个段之间重复,而段之间没有共享状态吗?
sql-server - SSIS 数据传输添加字符(SQL Server 到 Postgres)
我创建了一个 SSIS 包,它从 SQL Server 数据库中取出地理数据并将其复制到Greenplum
Postgres 数据库中的几何列。
由于PGNP驱动程序在以正常方式尝试时出现奇怪错误,我正在以迂回的方式进行操作。所以我正在做的是GeogColumn.STAsText()
在 SQL Server 源上使用并将其插入到数据库中的文本列中,然后运行一个任务,使用新插入的文本Greenplum
更新表中的几何列,例如应该看起来像.Greenplum
POLYGON(-85 42, -86 43)
问题是\\000在每个字符之后添加,然后更新将不起作用。这是它的样子:
来源
目的地
我该如何阻止这种情况发生?
sas - SAS Proc SQL 将常量添加到变量
我有一个带有数字变量to
、from
和的 SAS 数据集weight
。一些观测值的值为 0 weight
。我需要所有的weight
值都是正数,所以我希望简单地将所有weight
值加 1。
如何使用 Proc SQL 做到这一点?
我尝试了以下方法,但它不起作用:
错误是:
此外,mylib
指的是 Greenplum 设备。这可能是问题...
mule - 如何将记录从 Mule 插入 GreenPlum 数据库?
这个问题是How to read CSV file and insert data into PostgreSQL using Mule ESB, Mule Studio的一个变体。早些时候我们有 PostgreSQL,但现在它已更改为 GreenPlum 数据库。但是 PostgreSQL 在 Mule Studio 中有原生支持,但在 GreenPlum 数据库中没有。
我该怎么做这个插入?
sql - 根据小时过滤窗口功能
我想使用两个不同(但相似)的窗口函数来计算两个值
SUM
和COUNT
on is_active over user_id+item
,只到行的时间 - 负 1 小时。我的直觉是使用 ROWSUNBOUNDED PRECEDING
但这样我就不能随着时间的推移进行过滤
但是,这没有考虑“1 小时前”间隔因素
考虑以下数据:
我希望得到以下结果:“值 1”是 SUM(is_active),“值 2”是 COUNT(1):
我正在使用基于 Postgresql 8.2.15 的 Greenplum 4.21
提前致谢!吉利比
kerberos - Greenplum 是否支持其节点之间的 Kerberos 身份验证?
我需要“kerberize”我们的 Greenplum 集群。其中一个方面是我应该对 GP 主机和它的分段主机之间的接口进行 kerberize 处理。我无法确定这是否受支持。
我已经看到了 posgresql.conf 文件中的参数(krb_server_keyfile 和 krb_srvname)并尝试设置这些参数,但它似乎不起作用(Greenplum 仍然有效,它只是没有显示连接是 kerberized)。
我用 hadoop 做到了这一点,它非常简单,但是,再一次,无法弄清楚如何在 GP 中做到这一点,或者是否有可能。有任何想法吗?
谢谢
postgresql - 从 PostgreSQL 中的文件向表中插入数据,不带双引号
我有一个包含一些数据的文件,我需要在表格中插入这些数据。我正在使用gpfdist-external table - table
加载文件。
我能够在表中加载数据,但我的问题是输入文件中的字段用双引号括起来,如“Emp Name”,同样会进入数据库。我不希望这些双引号进入数据库。只有那些引号内的值应该去。
我在某个地方找到了这个 [ENCLOSED BY '"'] 但它在 greenplum 中不起作用。请告诉我我可以在我的外部表中更改的位置,以便只有双引号内的值应该进入数据库而不是双引号。
谢谢和问候,阳光
sql - 在 Greenplum 中实现公用表表达式
有没有办法强制Greenplum PostgreSQL在一个WITH
子句中实现子查询,就像Oracle中MATERIALIZE
的INLINE
优化器提示在下面所做的那样?
我已经搜索了一段时间,只是在 Oracle 中找到了这个功能。
我知道我可以使用CREATE TABLE AS
,但是我有几个类似的查询,迫使我在每次查询后删除临时表,这非常不方便,而且可能效率低下。
更新:我测试了下表:
我正在使用 Greenplum Postgresql 8.2