问题标签 [predictionio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1626 浏览

linux - 错误:尝试在 Linux 机器中构建 PredictionIO 的推荐引擎时出现无效或损坏的 jarfile

尝试使用 PredictionIO 构建推荐引擎时发生错误。请任何人知道如何解决这个问题。

0 投票
1 回答
815 浏览

apache-spark - spark中的混合推荐器

我正在尝试使用 prediction.io 构建一个混合推荐器,它充当引擎盖下 spark/mllib 之上的一个层。

我正在寻找一种在进行推荐请求时在 ALS 算法中加入基于标签的提升的方法。

使用内容信息来改进协同过滤似乎是一条常见的路径,尽管我找不到任何关于将协同算法(例如 ALS)与基于内容的度量相结合的文档。

任何关于将内容相似性与 mllib (spark) 或 mahout (hadoop) 的协作过滤相结合的示例或文档将不胜感激。

0 投票
1 回答
137 浏览

python - 未找到更新元信息

完成安装 PredictionIO 和下载引擎模板。使用 Python SDK。

pio build --verbose 给出以下内容:

它只是没有更进一步。

0 投票
2 回答
507 浏览

prediction - 分类器中的 PredictionIO 评估

是否有人使用 PredictionIO 进行了正确的评估?

我在服务器中使用分类模板,但使用更多属性,它使用我获得的数据集进行训练,并且可以很好地进行预测。但是,它无法进行评估,并且我已经标记了所有数据,用于训练算法的数据......

错误:

线程“main”java.lang.IllegalArgumentException 中的异常:要求失败:PreparedData 中的 RDD[labeledPoints] 不能为空。请检查 DataSource 生成 TrainingData 和 Preparator 生成 PreparedData 是否正确。

DataSource.scala 和 Preparator.scala 应该按原样工作。

谢谢你的帮助

0 投票
1 回答
384 浏览

web-services - 如何将预测引擎作为服务运行

我已经成功实现了 predictionIO 引擎模板。我可以部署一个引擎

但是我怎样才能运行推荐(或任何其他)engine as a service?如果出现某些问题,我想将所有条目记录到指定的文件中以供参考。

它还提到,small deployments最好不要使用分布式设置。我有一个用于文本分类模板的 json 格式的数据集,大小约为 2MB,它需要大约 8GB 的​​内存来训练和部署引擎。这符合small deployment类别吗?

0 投票
1 回答
249 浏览

amazon-web-services - 使用 AWS CloudFormation 部署 PredictionIO

我刚刚按照predictionio 文档中描述的示例过程在 AWS CloudFormation 上创建了 PredictionIO 集群,但我的堆栈在创建后立即回滚。

你们中有人成功地遵循了文档吗?

0 投票
1 回答
204 浏览

predictionio - Prediction.io 文本分类返回无效的置信度值 NaN

在尝试对一些文本内容进行分类时,我经常会得到类似这样的结果:

除了它不是有效的 JSON(Nan未经授权)之外,我不明白发生了什么。

如有必要,我可以通过在计算期间附加调试器来提供中间值。

0 投票
1 回答
562 浏览

algorithm - PredictionIO - 一个引擎和多种算法

我被一个引擎和多种算法困住了,需要进一步的帮助。

我有一个引擎和两个算法,我们称之为 AL1 和 AL2。在 src/main/scala 中有 2 个算法 scala 文件,名称为 AL1Algorithm.scala 和 AL2Algorithm.scala,每个算法都有自己的参数和模型(AL1AlgorithmParams 和 AL1Model 用于 AL1,AL2AlgorithmParams 和 AL2Model 用于 AL2)。因此有 2 个训练函数和 2 个预测函数。

我可以通过调用 pio train 来训练 2 种算法。当我调用 send_query 进行测试时,程序总是返回我放在 engine.json 文件顶部的算法的结果

例如,如果我将 AL1Algorithm 放在顶部,send_query 将运行 AL1Algorithm

如果我将 AL2Algorithm 放在顶部,send_query 将运行 AL2Algorithm'

我的问题是,我可以为一个 send_query 调用 2 个算法,如何区分应该在 send_query 而不是 engine.json 中调用哪个算法。这里有些奇怪,我认为我的配置有问题。Serving.scala 会同时产生 2 个算法的结果。我可以在服务中拆分每个算法的结果吗?

非常感谢

0 投票
1 回答
719 浏览

logistic-regression - 未找到密钥:逻辑回归预测 IO 中的 regParam

我正在使用TextClassificationEngine. 在https://docs.prediction.io/demo/textclassification/给出示例,有两种算法(朴素贝叶斯和逻辑回归)用于文本分类。朴素贝叶斯算法工作正常,但是当我使用逻辑回归时,它给出了一些错误。

上面的代码是现场给出的,regParam由于数组,它有一些错误。谁能解释一下逻辑回归的最终结果是regParam什么?engine.jsonengine.json

0 投票
1 回答
1168 浏览

machine-learning - 推荐系统:是基于内容的过滤吗?

有人可以帮我澄清一下。

我目前正在使用协同过滤 (ALS),它返回一个推荐列表,其中包含与推荐项目相对应的分数。除此之外,如果项目包含与用户指定他们喜欢的标签(例如“浪漫电影”)相对应的标签,我会提高分数(+0.1)。对我来说,这被认为是一种混合协作方法,因为它通过基于内容的过滤来提升协作过滤结果(如果我错了,请纠正我)。

现在,如果我在不进行协作过滤的情况下采用相同的方法怎么办?它会被认为是基于内容的过滤吗?因为我仍然会根据用户指定他们喜欢的每道菜的内容和属性来推荐菜品(例如“浪漫电影”)。

我感到困惑的原因是因为我已经看到了基于内容的过滤,它们应用了诸如朴素贝叶斯等算法,这种方法类似于对项目的简单搜索(在内容上)。