问题标签 [recommendation-engine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - 从 pig 中的分组数据生成二元组合
给定我的 userid,itemid 格式的输入数据:
我想生成每个组中项目的所有组合(顺序不重要)。我最终打算对我组中的项目执行 Jaccard 相似性。
理想情况下,我的二元组将被生成,然后我将输出展平为:
代表用户 ID 的字母 ABC 并不是输出所必需的,我只是为了说明目的而展示它们。从那里,我会计算每个二元组的出现次数以计算杰卡德。我很想知道是否有其他人正在使用 pig 进行类似的相似性计算(对不起!)并且已经遇到过这种情况。
我查看了猪教程随附的 NGramGenerator,但它与我想要完成的内容并不匹配。我想知道也许 python 流 UDF 是要走的路。
dataset - Apache Mahout 的数据集
我正在寻找可用于实现 Apache Mahout 推荐系统用例的数据集。我只知道GroupLens 研究组的MovieLens 数据集。
任何人都知道可用于推荐系统实施的任何其他数据集吗?尽管其他数据集最受欢迎,但我对基于项目的数据集特别感兴趣。
web-services - SOAP 和具有开源平台的远程服务,建议
我是一名 .Net 开发人员,但过去曾为了好玩而进行过开源开发。我需要关于哪些开源语言比其他语言工作得特别好(甚至更好,稳定)的建议。
在家里,我在 LAMP 服务器上开发网站,更喜欢 PHP 和 Python。这些中的任何一个都非常适合远程数据/方法吗?如果可能的话,我希望有类似于 .Net 的 WCF 的东西。
php - 升级 PHP/MYSQL 应用程序?
我正在寻找有关如何管理本土 php/mysql 应用程序的升级过程本身的输入。意思是,如果我们的生产服务器上有一个“稳定”版本的 php/mysql 应用程序,我们现在想将它升级到我们正在开发的下一个版本 - 我们如何优雅地做到这一点?我应该实施哪些实践?
我打算做的只是
要求开发人员在完成所有稳定性/功能测试后停止签入代码
使应用程序脱机***(问:我应该如何防止 ppl 登录/访问公共页面?最佳实践?)但允许通过秘密登录页面/url 访问开发人员
- 登录生产服务器并在本地查看最新版本***
- 让开发人员/测试人员通过秘密访问页面/网址测试他们的代码***
- 完成后,我们通过删除此秘密访问页面/url、删除站点维护页面并恢复对所有人的访问来恢复对所有人的访问。
***注意:执行此操作的一种简单方法是将 /myapp/ 重命名为 /myapp.old/ 并将新的应用程序版本放入 /myapp.new/ 开发人员将访问 /myapp.new/,测试到他们满意并然后在我们完成后,我们会将其重命名为 /myapp/ (这只是基本想法)
.net - 适用于 Windows 7 手机的 ORM 映射器
我正在考虑将 SQLite 与 win7 手机一起使用来开发我的应用程序。我正在寻找一个适用于 Windows 7 手机和 SQLite 的 ORM 映射器。
recommendation-engine - 学习mediawiki的最佳资源?
您能推荐一些关于 mediawiki 的易于理解的教程吗?
php - Aptana:哪个更好?单机版还是 Eclipse 插件版?
我是 ubuntu 的新手,想选择我的 php/javascript IDE。有两个下载选项:
单机版
和
Eclipse 插件版本
性能和不要太重对我来说很重要。
我应该下载哪一个?
将它作为 Eclipse 插件下载有什么好处?它对我在 PDT 旁边使用它有帮助还是不建议这样做?
iis-7 - 学习 Windows Workflow Foundation 4,从哪里开始?
我一直在玩 wf4 一段时间。我找到了各种关于 wf4 的文章、视频(第 9 频道)、博客文章和网站,但无法以适当的方式组织它。
我期待为
- 带有 VS 2010 和 IIS 7 的 Windows 工作流 4(没有 AppFabric)
- 带有 VS 2010 和 IIS 7(带有 AppFabric)的 Windows 工作流 4
请帮我创建它...
发布您的答案
- 从哪儿开始?
- 先学什么?
- 必须学习的主题 - 按重要性顺序
- 作为 WCF 服务发布
- 托管
recommendation-engine - 推荐引擎有哪些方法可以处理一次性的、新颖的和潜在重要的内容?
假设您构建了一个推荐引擎,可以推荐您观看直播电视节目。对于常规节目,您可以使用协同过滤等做得很好。但可以说它类似于 1969 年的登月。这显然是一个重要事件,您希望您的推荐引擎来处理这种情况。但是你也不能依赖过去的行为,因为一旦节目结束,该推荐的价值就会下降到零。
在推荐空间中有哪些有效的方法来处理这个问题?
algorithm - 如何不断过滤用户感兴趣的数据?
以带有“浏览”幻灯片的问答网站为例,该幻灯片一次显示一个问答页面。用户点击“下一步”按钮,一个新的问题/答案就会呈现给他。
我需要决定每次用户单击“下一步”时应返回哪些页面。我不想要的一些事情以及原因:
按降序显示“最新”问题:
假设输入了 100 个问题,那么没有用户会点击到第 100 个项目并且它永远不会得到任何响应。这也意味着如果最近没有提出新问题,每次用户访问该站点时,他都会看到相同的重复陈旧数据。
显示“最活跃”的问题,由大量建议的答案/评论判断:
这不会返回那些活动较少的问题,而这些问题正是需要更多可见性的问题
显示“低活动”问题,由没有很多答案/评论判断:
一旦问题开始获得活动,它将停止显示。当我真的很想鼓励讨论时,这将阻碍问题的活动。
我觉得混合使用这些会很好,但我不确定如何判断应该返回哪些页面。我要强调的是,我不希望用户必须选择要查看的项目类别(例如 SO 如何具有未回答/活动/最新的过滤器)。
是否有这样做的常见做法,或者关于如何完成的任何想法?
谢谢!
编辑:
这就是我目前所倾向于的,非常感谢蒂姆的评论:到目前为止,我正在考虑按活动计数/查看计数对页面进行排名,每次用户在页面上执行操作时,活动都会增加,比如投票,评论,回答等。每次有人查看页面时,每个页面的视图都会增加。
然后,我将按活动/查看比率对所有页面进行排名,并更频繁地显示具有高比率的页面。这样,活跃度低、浏览量高的页面显示最少,而活跃度高、浏览量低的页面显示频率最高。低活跃度/低浏览量和高活跃度/高浏览量将在我想的中间某个地方,但我必须在 beta 版本中密切关注这一点。我还计划存储用户在过去 24 小时内查看过的页面,这样他们就不会在某一天的幻灯片中看到任何重复。
一些防止“陈旧”数据的想法(如果以上所有方法似乎都不能阻止它):也许运行一个 cron 作业,该作业将定期检查最近未查看的页面并提高它们的比率以将它们放在顶部.