问题标签 [predictionio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
381 浏览

evaluation - 文本分类模板的 Predictionio 评估失败

我正在尝试根据 predictionio 上的其他文本字段来预测文本字段。我使用指南作为参考。我使用创建了一个新应用程序

并按照指南使用模板中提供的数据源进行评估。一切都还好,直到评估。在评估数据源时,我收到如下粘贴的错误。

我是否必须编辑任何配置文件才能使其工作?我已经成功地对movielens 数据进行了测试。

0 投票
1 回答
1170 浏览

java - Predictionio 评估因 empty.maxBy 异常而失败,并使用 java.lang.OutOfMemoryError 进行训练

我已经下载了文本分类模板的最新更新。我创建了一个新应用程序并通过指定应用程序 ID 导入了 stopwords.json 和 emails.json

然后我更改了 engine.json 并在其中给出了我的应用程序名称。

但是下一步,即评估失败并出现错误empty.maxBy。部分错误贴在下面

然后我尝试pio train了,但在显示一些观察结果后训练也失败了。显示的错误是java.lang.OutOfMemoryError: Java heap space。错误的一部分粘贴在下面。

这是因为内存不足吗?我已经使用大于 40mb 的文本分类数据运行了相同模板的先前版本,没有问题。评估是培训的必要条件吗?另外,您能否解释一下评估是如何进行的?

0 投票
2 回答
753 浏览

machine-learning - Is it Item based or content based Collaborative filtering?

I am currently working on an existing system that recommends items that are similar to previous items that the user has liked.

It uses Alternating least squares Collaborative Filtering to find feature vectors of users and items. It then uses the feature vectors of the items and uses the cosine similarity measure to find similar items to it.

However, I would like some clarification as to whether this is item based CF or content based filtering? My inclination is that it is both. Since it is using a similarity measure to compare items, but the items are on the content of the feature vector?

Thanks,

0 投票
1 回答
1351 浏览

url - Predictionio 非常大的任务规模

我正在使用推荐引擎并修改了我的数据集。我的数据集中的几行如下

我可以成功构建训练和部署引擎。但是在发行pio train时我得到了太多very large task size messages。我认为这不是一个严重的问题,因为我可以毫无问题地部署引擎并使用 REST API。部分消息粘贴在下面。

网址还http://localhost:7070/events.json?accessKey=<Access_Key>显示所有事件还是部分事件?我已经导入了 20k 多个事件,而 url 只显示了大约 50 个事件。

0 投票
1 回答
288 浏览

token - PredictionIO 训练错误标记不能为空

我正在修补 predictioIO 以构建自定义分类引擎。我以前做过这个没有问题。但是对于当前数据集pio train给了我一个错误tokens must not be empty.,我编辑了 Datasource.scala 以将数据集中的字段提到引擎。我的数据集中的一行如下

我可以毫无问题地导入数据和构建引擎。我也得到了一组观察结果。错误粘贴在下面

问题出在数据集上。我确实将数据集分成几部分并进行了训练。该数据集的训练已完成,没有报告错误。我如何知道数据集中的哪一行产生错误?如果此功能在 PredictionIO 中应该非常有用。

0 投票
2 回答
476 浏览

java - PredictionIO start server throws Unsupported class version errors in centos 6

I have installed predictionIO in RHEL 6.6. But when I start pio with pio-start-all I am getting error as follows

pio server is not started after all. I have created a new user and installed java for that user as the system wide java installation is 1.6. I have successfully installed java 1.8 for the new user

I have edited path in pio-start-all to point to my java installation since pio-start-all cannot find jdp. I have checked my java path.

After changing path in pio-start-all from /home/me/jdk1.8.0_45/bin/bin to /home/me/jdk1.8.0_45/bin jdp error was fixed but I am struck at current error. I have installed pio in a couple of ubuntu machines and servers, customized pio to meet my custom engine template requirements and it is running without issues. Do predictionIO supports Redhat? Hope this is all the error trace you needed. thanks in advance :)

0 投票
1 回答
250 浏览

scala - PredictionIO 训练引擎失败并出现错误 - WorkflowConfig 为空。退出

我正在尝试部署引擎。我正在关注文档。所以我:

  • 创建应用程序,
  • 下载引擎,
  • 更新应用程序名称engine.json
  • 建造它:pio build --verbose,
  • 然后训练:pio train --verbose

一切正常,构建成功完成。但是,训练总是失败并出现错误:

我尝试下载另一个引擎,但错误是一样的。互联网上没有关于WorkflowConfig. 有谁知道可能出了什么问题?

我在下面附上了 pio.log 内容。

0 投票
1 回答
169 浏览

java - PredictionIO IntelliJ 设置。缺少模块 SDK

我正在尝试为 Scala 中的 PredictionIO 引擎开发设置 IntelliJ Idea。我正在逐步遵循文档。但是,由于缺少 SDK,我无法构建项目。

在此处输入图像描述

我已经安装了 JDK。我应该在那里指向这个 SDK 吗?感谢帮助!

0 投票
1 回答
419 浏览

java - 使用 Apache Storm 的实时 Prediction.io

我想实现一个可以实时生成推荐音乐播放列表的音乐推荐系统。我相信这可以在 Prediction.io 中实现......

但是,由于 Prediction.io 的设计,我需要调用 pio train、pio deploy,以便使用用户执行的新操作(如音乐等)更新学习模型。因此,我需要运行这些命令每 2 小时(或另一个适当的时间间隔)。

我最近遇到了 Apache Storm,我真的很喜欢“实时 hadoop”处理的概念。因此,我在考虑是否可以将 Prediction.io 与 Apache Storm 结合起来,以便“在线”完成学习,这将允许我的应用程序在用户的一些喜欢/动作中推荐音乐,而不是让用户等待直到学习模型更新。

如果这不可行,那么是否可以将 Spark 的 Mllib 合并到 Apache Storm bolt (java) 中,因为我可以用它构建推荐系统(而且 Prediction.io 本身似乎也是基于 Apache Spark 构建的)?

提前致谢!

0 投票
1 回答
295 浏览

amazon-web-services - PredictionIO 无法让引擎在 AWS 上运行

我正在尝试按照AWS 上的教程部署我的分类引擎。

在 localhost 中,您在端口 7070 中部署事件服务器,然后在端口 8000 中部署引擎,但在 AWS 中,您正在运行事件服务器,并且“pio deploy”尝试在 0.0.0.0:8000 中部署引擎,或者如果我尝试使查询我的 DNS:7070 我得到:

如何正确部署引擎并使用 AWS 进行查询?

谢谢你的帮助 :)