问题标签 [recommendation-engine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 构建推荐引擎时应该考虑什么?
我读过《编程集体智能》一书,觉得它很吸引人。我最近听说亚马逊向全世界发布了一项挑战,旨在为他们的系统提供更好的推荐引擎。
获胜者显然通过限制提供给它的信息量来产生最好的算法。
作为第一条经验法则,我猜......“在模糊算法方面,更多信息不一定更好。”
我知道这是主观的,但最终它是可衡量的(响应推荐的点击)。
由于这些天我们大多数人都在处理网络并且搜索可以被视为一种推荐形式......我怀疑我不是唯一一个会欣赏其他人对此想法的人。
简而言之,“建立推荐的最佳方式是什么?”
sql - 如何实现类似 Digg 的算法?
如何用类似于stackoverflow/digg/reddit的推荐系统来实现一个网站?即,用户提交内容,网站需要根据项目的受欢迎程度来计算某种“热度”。流程如下:
- 用户提交内容
- 其他用户查看内容并对内容进行投票(假设 90% 的用户只查看内容,而 10% 的用户对内容积极投赞成票或反对票)
- 新内容不断提交
如何实现一个算法来计算提交项目的“热度”,最好是实时计算?是否有任何最佳实践或设计模式?
我假设该算法考虑了以下因素:
- 提交项目时
- 每次投票时
- 查看项目的时间
例如,一个获得持续不断的投票的项目会一直保持一定的“热度”,而一个在首次提交时获得大量投票的项目将跳到“热度”列表的顶部,但随后随着投票而下降别进来了
(我使用的是 MySQL+PHP,但我对一般设计模式感兴趣)。
search - 开源全文文章推荐引擎
我想知道开源项目中是否有任何好的 .NET 推荐算法可用,无论是否附加到搜索引擎。推荐是指接受全文文章并根据关键字相似度从其索引中推荐其他文章的东西。
在高端有像 Autonomy 这样的文档分类引擎;在低端垃圾邮件过滤器和博客“相关帖子”小部件上。也可能是广告到文章的匹配。我想将一个合并到一个项目中,但买不起高端,而低端似乎都是基于 LAMP 的。
[抱歉,有一个答案要求澄清:我正在寻找理想的独立库,但我愿意根据需要调整好的源代码。最终结果是我需要能够创建一个 C# 服务,该服务接受任意数量的文本并返回类似的先前索引文章的列表。基本上,StackOverflow 本身在您提交问题时所做的确切事情!]
谢谢!史蒂夫
rating - 随机集评级中的项目评级
当我自己的输入为用户提供这些项目的随机集并让他们告诉我哪些评级或标签在该集中时,我正在寻找一种算法来确定项目的评级或标签。例如,他们可能会说一组图像是否包含任何“好”的照片,并且是从几个随机集合中选出的,然后我想确定哪些照片是好的。现在,我还可以调整我给用户的项目集,以帮助我完善这些项目的知识。所以,如果一个给定的项目在标记为“好”和“坏”的集合中,系统会尝试将它放在已知好的项目集合中,也许,以确定用户现在是否说该集合有一个坏项目,并且我知道状态不确定的是“坏”项目。这有意义吗?
php - 对 Web 的集体编程感兴趣——Ruby、Python 或 PHP?
对于个人推荐系统,网站上的机器学习类型的东西,哪种语言最好?
algorithm - 推荐系统是如何工作的?
我一直很好奇这些系统是如何工作的。例如,netflix 或亚马逊如何根据过去的购买和/或评分确定要提出的建议?有什么算法可以阅读吗?
只是为了这里没有误解,我没有实际的理由问。我只是出于好奇而问。
(另外,如果有关于这个主题的现有问题,请指出它。“推荐系统”是一个很难搜索的术语。)
recommendation-engine - 为什么 Netflix Prize 如此具有挑战性?
刚刚阅读了《连线》杂志上的最新文章,我很好奇:Netflix 奖有什么挑战性?我的意思是最真诚的,我只是对比赛带来的困难感到好奇。大多数推荐引擎一般都很难改进吗?如果是这样,那是为什么?或者,Netflix 是否异常难以改进?如果是这种情况,Netflix 有什么特别之处,使它比亚马逊更具挑战性?
python - Weighted slope one algorithm? (porting from Python to R)
I was reading about the Weighted slope one algorithm ( and more formally here (PDF)) which is supposed to take item ratings from different users and, given a user vector containing at least 1 rating and 1 missing value, predict the missing ratings.
I found a Python implementation of the algorithm, but I'm having a hard time porting it to R (which I'm more comfortable with). Below is my attempt. Any suggestions on how to make it work?
Thanks in advance, folks.
mysql - 推荐引擎数据库的设计?
我目前正在研究推荐系统,尤其是音频文件。但我是这个主题的初学者。我正在尝试先用 mysql 设计数据库,但我无法决定如何去做。它基本上是一个用户创建配置文件然后搜索的系统为音乐和系统推荐他们喜欢的音乐。
- 我应该使用哪个数据库?(我首先想到的是 Mysql)
- 这是一个网络项目,然后是移动端。我应该使用哪些技术?(php,android平台......)
- 这个项目有什么陷阱。
- 如何为这样的系统设计数据库?
database - 如何创建自己的推荐引擎?
这些天我对推荐引擎很感兴趣,我想在这方面提高自己。我目前正在阅读“ Programming Collective Intelligence ”,我认为这是 O'Reilly 写的关于这个主题的最佳书籍。但我不知道如何实现引擎;我所说的“不知道”是“不知道如何开始”。我有一个像 Last.fm 这样的项目。
- 我从哪里开始创建推荐引擎(应该在数据库端或后端实现)?
- 需要什么级别的数据库知识?
- 是否有任何可用于帮助或任何资源的开源?
- 我必须做的第一步应该是什么?