问题标签 [madlib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
345 浏览

madlib - 我可以将 Madlib 与 Amazon Redshift 一起使用吗?

Madlib 网站建议它与 Postgresql 兼容。Amazon Redhift 基于 Postgresql。可以在 Redshift 上安装 Madlib 吗?

0 投票
1 回答
271 浏览

madlib - MadLib 在 Mac OSX 上是否支持 PostgreSQL 9.5?

我尝试使用自制软件和其他说明进行安装...它们不适用于 postgres 9.4 或 9.5,并给我留下如下错误:

/pgdata95$ /usr/local/bin/madpack -p postgres -c db@localhost/mad install madpack.py:信息:检测到 PostgreSQL 版本 9.4。madpack.py:错误:此版本不在已安装 MADlib 支持文件的 PostgreSQL 版本中()。

我正在从源代码编译以查看是否有效。

0 投票
0 回答
166 浏览

centos - 在 Cent 操作系统中安装 Madlib

我是 CentOS(一般是 Linux)的新手,并且在安装 Postgresql 和 Madlib 时遇到了困难。我相当有信心我已经成功安装了 Postgresql。我在使用 wget 命令和正确的 rpm 地址时遇到问题。

链接到 Madlib 下载页面

我努力了

但得到错误

我不知道该怎么办。我能找到的大多数文档都是针对旧版本的,而且该网站似乎托管在与现在不同的网址上。

0 投票
0 回答
86 浏览

r - 无法使用 PivotalR 库在 Rstudio 中获取 madlib.forest_train()

我已将 RStudio 配置为在 Greenplum 上本地运行 R 代码。我已经在网上搜索过,但我无法找到我目前面临的问题的答案。

我已经导入了library(PivotalR)and library(RPostgreSQL)。但是,当我输入madlib它时,它只提供了一些功能:

在此处输入图像描述

Greenplum 数据库还配置了 Madlib 函数,包括madlib.forest_trainRStudio 中不显示的函数。我假设它与 RStudio 的 PivotalR 包有关。有没有办法forest_train直接从 RStudio 进行工作?

0 投票
2 回答
1768 浏览

sql - 如何在 PostgreSQL 中快速将 2d 数组取消嵌套到 1d 数组中?

我有一个用 Apache Madlib 计算的非常大的数组,我想对该二维数组中的每个单个数组应用一个操作。

我找到了可以帮助我从这个相关答案中解开它的代码。但是,在这个非常大的二维数组(150,000+ 1d 浮点数组)上,代码非常慢。虽然unnest()只需要几秒钟即可运行,但即使等待了几分钟,代码也没有完成。

当然,必须有一种更快的方法将大型二维数组取消嵌套到较小的一维数组中吗?如果该解决方案使用 Apache Madlib,则可以加分。我确实在名为 的文档中找到了一条线索deconstruct_2d_array,但是,当我尝试在矩阵上调用该函数时,它失败并出现以下错误:

错误:函数“deconstruct_2d_array(双精度[])”:类型转换无效。内部复合类型比后端复合类型具有更多元素。

0 投票
0 回答
234 浏览

postgresql - pgxn 安装 madlib UBUNTU 16 LTS 不工作

该命令在UBUNTU 16 LTSpgxn install madlib (xenial) 出现很多错误... UBUNTU 的 MADLib 安装存在错误?


另请参阅MADlib apt install,如何?

0 投票
2 回答
86 浏览

greenplum - 在 Greenplum 上使用 madlib 库执行 kmean 时出错

我正在尝试kmean使用库运行算法madlib,使用的工具 aginity 尝试执行:

我的表名是sample_sordetail

我收到错误消息:

错误:XX000:plpy.Error:kmeans错误:数据表不存在!(plpython.c:4648)

请建议如何解决此问题。

0 投票
2 回答
292 浏览

postgresql - Docker Madlib Postgres

我试图在 Postgres 上安装 Apache MADLib。在使用 YUM 方法时遇到困难,我按照本网站https://pgxn.org/dist/madlib/的建议转向了 Docker 方法

我能够按照第 1 段的建议提取 docker 映像。现在在第 2 段,我被评论“孵化器-madlib 目录的路径”卡住了。我无法理解它是否应该是 MADLib 孵化器的 URL,例如“ https://github.com/apache/incubator-madlib ”,或者它应该是指本地磁盘区域。举个例子来说明如何运行这个命令会很棒。

2)启动MADlib镜像对应的容器,将源码文件夹挂载到容器中:

0 投票
1 回答
287 浏览

postgresql - 如何在使用 MADlib-postgre 训练线性回归模型时使用非数字自变量?

我的表包含一个字符字段和两个数字字段:

我想用 Char01 和 PLNumeric01 作为自变量,PLNumeric02 作为因变量来训练线性回归模型。

当我在上面运行查询时,它失败并出现以下错误:

如何使用非数字字段作为自变量?

0 投票
1 回答
45 浏览

postgresql - Postgres-MADlib 预测花费的时间比训练时间长

我正在使用以下代码训练我的数据:

我的预测代码如下:

训练数据包含 450000 条记录,而测试数据集包含 50000 条记录。

尽管如此,我的平均训练时间约为 17173 毫秒,而预测时间为 26481 毫秒。根据我对朴素贝叶斯的理解,prediction_time 应该小于 training_time。我在这里做错了什么?