问题标签 [greenplum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - 用于导入数据的 Greenplum windows 服务
我已经在本地机器上安装了 windows 服务,所有设置看起来都不错。但是,当我从外部表中读取时,我得到 http 响应代码 500。
错误信息 -
我不确定如何解决此错误
oracle - 将数据从 ORACLE 视图传输到 greenplum DB 表
我有一个 Oracle 视图,其中包含大量数据,我想将这些数据迁移到 Greenplum 数据库的表中。有什么方法可以在 Postgresql 中编写任何查询来获取该 Oracle 视图的数据?
如果在 Postgresql 中无法通过查询,请建议我通过某种方式从 Linux 服务器访问 Oracle 视图,以便我可以从该 Oracle 视图创建数据文件到我的 Linux 服务器,并通过 gpfdist 将该文件加载到 Greenplum 表中。
注意:Oracle 视图来自第三方,我只能查看该数据(我拥有所有连接信息)我可以通过 SQL Developer 访问该视图 注意:将数据从 SQL Developer 导出到我的本地计算机在这里是不可行的因为数据非常大
谢谢,阳光
sql - 如何解释这个涉及 current_date 的插入语句的行为
我正在对 postgreSQL 8.2 的分叉 MPP 版本尝试一个非常简单的测试查询,我试图弄清楚这是否是预期的行为。
当我使用 current_date 为单行执行插入语句时,我得到当前日期的预期输出:
但是当我在插入语句中添加多行时,我得到了一个意想不到的结果——这是标准的一部分吗?
我的问题是:为什么当我使用 current_date::date 时第一个插入语句输出正确的日期,而当我使用相同的 current_date::date 转换时第二个插入输出两个不正确的日期?
greenplum - 查询特定值的分区表名称
我已经按timestamp with timezone
列对表进行了分区。然后我添加了一个分区,然后在该分区上添加了一个索引。现在看来,Greenplum只在vacuum analyze TABLENAME
. 否则,它使用顺序扫描。
缺点vacuum analyze TABLENAME
是需要很长时间。它想做一个vacuum analyze PARTITIONTABLENAME
,因为我知道上个月的每日分区已经没有改变了。
问题是:如何获取特定值的分区表名称,例如current_timestamp
?换句话说:我想访问 Greenplum 用来决定在哪个分区中放置新条目的函数。
r - 将表单 R(客户端)连接到 Greenplum 服务器
我正在尝试将 greenplum 集群中的数据检索到 R(win 客户端)中。我试过了:
我收到错误:0A000 7 错误:未实现跨数据库引用
我已经看到了一些关于 dblink 的答案,但是当我尝试时: sql <- "select dblink_connect('conn', 'dbname=myDB');" cen_data <- sqlQuery(conn,Sql)
我收到错误:“42883 7 错误:函数 dblink_connect(unknown, unknown) 不存在
有谁知道我做错了什么?
greenplum - 关于 greenplum 错误 22003 的 Madlib
我正在尝试在大型数据集上测试 madlib linregr_train 函数。对于自变量的某些组合,我得到以下错误:
ERROR: 22003: "0.0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000536555291383594" is out of range for type double precision
有时,如果我对数据集进行采样,这些错误就会消失。以前有没有其他人遇到过这个问题?是否有一个选项可以让我将这些数字四舍五入为零,或者让我知道结果被四舍五入而不是出错?
postgresql - Greenplum匿名代码块错误?
我们在 Greenplum 中有一个带有 Postgres 版本 8.2 的模式,我们不允许在其中创建函数。我们在另一个服务器/模式中有一些工作功能。我们喜欢以匿名代码块的形式在新模式中运行这些函数。我们在 pgadmin(Gui 界面)和命令行 psql 中尝试了以下操作。我们遇到了一个错误。
这是尝试过的代码。
它不接受“做”。这就是错误所在。我需要你的指导才能完成这项工作。
是否有像 Oracle 的 DB 链接这样的机制可以跨 greenplum 实例/模式对象使用?
postgresql - 最小和最大日期的 generate_series
这是我想在 Greenplum 数据库中完成的非常基本的查询(如 postgresql 8.2.15)。
表 t 中的字段 create_date 是不带时区的时间戳。谁能指出我正确的查询来完成这个?谢谢。
它的投掷错误
第 1 行:select * from generate_series ((select EXTRACT (YEAR FROM MI... ^ 提示:没有函数匹配给定的名称和参数类型。您可能需要添加显式类型转换。
postgresql - PostgreSQL 查询基于连接条件和 max(date) 获取属性
我在下面有表格结构(屏幕)。我想要如图所示的结果查询:根据 row_wid 和 max(req_createdOn) 日期字段从第一个表和第二个表中,获取 req_attr1 和 req_attr_2 值。我正在使用 Greenplum 数据库(大致兼容 PostgreSQL 8.2)。
TIA。
第二个屏幕:如您所见,t1 中有两个 row_wid。对于 t2 中的 t1 中的每个 row_wid,我们需要检查最大的 req_createdOn 日期并获取 max(req_createdOn) 的 attr1、attr2。任何想法?很抱歉没有把这个条件放在第一个屏幕上。非常感谢。
java - maven intellij java mapreduce 测试程序
我在 IntelliJ 中创建了一个包含三个类文件的 maven 项目:
和
和主要...
这就是 pom.xml 的样子
我正在使用 hadoop 的 greenplum 发行版,现在..当我运行上述项目时,我收到此错误....
有任何想法吗?
更新:
如果我从命令行指定类路径的路径,它调用 Dictionary 类但给出错误,所以我的 IDE 上必须有一些设置,它没有在运行时指定 hadoop-core 的类路径.....
更新2:
添加commons-logging-1.0.3.jar的路径后......
更新 3:
添加 :/home/kshk/.m2/repository/commons-configuration/commons-configuration/1.6/commons-configuration-1.6.jar 到路径....
更新 4:
添加:/home/kshk/.m2/repository/commons-lang/commons-lang/2.1/commons-lang-2.1.jar 到类路径
编辑:
Intellij 中的库 jars