问题标签 [myrrix]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
myrrix - 遵循教程时摄取时 Myrrix java.io.IOException
我正在尝试按照教程来评估 Myrrix 是否满足我的协同过滤需求: http ://myrrix.com/quick-start/
在我的 Windows 7 笔记本电脑上,我能够运行独立的 java 二进制文件。我可以在端口 80 上加载 Web 界面。但是,当我去摄取样本 audioscrober 数据时,我收到以下消息:
我希望只需在命令行中添加“--localInputDir”指令即可解决问题。但是,这似乎与 Tomcat 服务器尝试上传的位置无关。
如何修改独立二进制文件,以便能够成功提取样本数据进行训练?
myrrix - Myrrix 是基于内容的推荐的好选择吗?
我了解 Myrrix 对 User > Item-based 协同过滤样式的支持,这对我来说效果很好;但我还需要使用自定义相似度算法来支持基于内容的项目推荐。因此,如果用户选择项目 X,他们也将能够看到 n 个最相似的项目,而与任何评分无关。
该算法将根据项目的内在特征和属性比较项目,我可以轻松地在 Java 中提供该算法,但 Myrrix 是否支持此算法?
recommendation-engine - Myrrix 推荐 vs 推荐匿名
在 Myrrix 中,为特定用户进行推荐查询与通过将该用户视为匿名并提供该用户的项目(假设我们有一个带有缓存和用于检索这些缓存的大型优化 MySQL 数据库)到推荐的匿名。
后者是否有任何显着的性能损失,忽略额外的数据库调用?
myrrix - RescorerProvider 按标签过滤元素
是否可以创建一个 RescorerProvider 来过滤掉与特定标签关联的元素?或者我应该使用第 79 页的“mahout in action”一书中的相关数据实现自己的模型?
路由:/recommend/?rescorerParams=sports
与标签运动相关的元素的推送分数
tomcat - 如何在 Myrrix 战争文件中设置像 --localInputDir 这样的标志?
在阅读了 Myrrix 的文档之后,我想知道如何设置如下标志:
部署为 .war 文件时。我想知道如何--
在 Tomcat 启动时设置这些标志?
myrrix - MYRRIX SERVING LAYER 的最小值数据集是多少
我对来自 audioscrobbler 的示例数据集没意见,该数据集共有 75K 用户和 50K 项。但是我的太小了,因为我在路的起点。所以很高兴知道 Myrrix 中使用的最小数据集是什么。问这个的原因是一个警告:
信息:聚合 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.DelegateGenerationManager$RefreshCallable runFactorization 信息:分解完成 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.Generation recomputeSolver 警告: X'*X 或 Y'*Y 有小的 inf 范数 (0.9254986853162671); 尝试减少 model.als.lambda 2013 年 8 月 14 日晚上 10:15:41 net.myrrix.online.generation.DelegateGenerationManager$RefreshCallable 调用警告:尚无法计算有效代;等待更多数据
感谢所有可以提供帮助的人
mahout - Duplicate records in data for Myrrix?
Can someone help me identify how Myrrix handles if there are duplicated records of in the input data? What would be the result in the case of implicit as well as explicit feedback data? What if explicit feedback duplicated records have different ratings?
identifier - myrrix 的字符串到 ID 映射的有效方法
Myrrix 只接受 long userId, itemId 进行处理,这会强制为具有字符串等项目的文件生成初始映射器。例如像这样的文件:
(爱丽丝,冰箱)(鲍勃,冰箱)
需要改为:
<1,1> <2,1>。
如果文件很大,此映射会花费大量时间。如果以后需要添加更多数据点,也会产生问题。关于加快此过程的任何建议?
machine-learning - 如何考虑 Myrrix 中的权重
Myrrix 有以下输入:
我正在寻找要推荐给用户 11 的项目。期望项目 333 将首先被推荐(因为用户 13 和项目 104、105、106 的权重较高)。
以下是 Myrrix 的推荐结果:
请注意,建议项目 222 的强度为 0.047,但项目 333 的强度仅为 0.033——与预期结果相反。
我还预计强度差异会更大(因为 1000 和 1 是如此不同),但显然,当订单甚至不是我所期望的时,这是没有实际意义的。
我如何解释这些结果以及我应该如何考虑重量参数?我们正在与一个大客户在紧迫的期限内合作,并希望得到任何指点。
myrrix - Random output from Myrrix for the same input
I'm getting slightly different results each time I run Myrrix, even though I'm giving it the exact same input. (I'm only running the serving layer.)
Is this expected behavior and if so how much can I expect the results to vary?
My spontaneous guess would be that the algorithm Myrrix uses is inherently nondeterministic due to the fact that it's built to be massively parallelized --- would that be a correct assessment?