问题标签 [recommendation-engine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 将偏好转换为评级
假设我有一个(例如)餐馆列表。很多用户会得到一组餐厅列表,然后选择他们喜欢的两个餐厅中的一个(a la hotornot)。
我想将这些结果转换为绝对评分:对于每家餐厅,1-5 星(如有必要,评分可以是非整数)。
解决这个问题的一般方法是什么?
谢谢
c# - 我正在寻找一个 SPARQL 查询程序
我有各种我想测试的 sparql 查询。是否有一个网站或简单的程序可以让我测试这些查询?
我不想要这样的验证器,但我想真正执行查询并获得结果。
recommendation-engine - 如何对“tastekid”和“clerkdogs”推荐系统进行分类
我想知道 Tastekid 和 clerkdogs 属于哪一类推荐系统?两者似乎都不需要用户进行任何评级。
java - JSR303 验证 - 使用来自自定义类验证器的组
我们有一个用例,其中我们有一个结构相当糟糕的 bean,其中包含如下字段:
仅当标志 [1|2] 为真时,我们才需要验证电话/地址/城市/州 [1|2]。糟糕,糟糕的设计,理所当然。
我们当前的策略是在每个“真实”数据字段上使用@NotNull(或我们需要的任何验证),并使用组指示符,如下所示:
在我们验证此 bean 的业务逻辑中(其中包含将由“默认”验证组验证的各种其他字段),我们将违反“默认”组,然后检查 flag1 是否为真,如果因此,对 Info.First.class 运行验证,检查 flag2 是否为真,然后对 Info.Second.class 运行验证。
现在的问题......有没有办法从自定义类验证器中连接到这些组?我设想有一个类验证器,它采用 flag1/flag2 属性及其相应的自定义组,当调用 isValid 时,它会为这些组执行这些二级/三级调用。简单地说,目的是自定义类验证器将位于默认组中,因此验证此类的业务逻辑不会因为必须单独调用验证而将这种丑陋的遗留设计的细节泄漏到其中。
想法?谢谢!
recommendation-engine - 使用 SVD 和 Movielens/Netflix 类型数据集的基本伪代码
我正在努力弄清楚如何开始使用带有 MovieLens/Netflix 类型数据集的 SVD 进行评级预测。我非常感谢 python/java 中的任何简单示例,或所涉及过程的基本伪代码。有许多论文/帖子总结了整体概念,但我不确定如何开始实施它,即使使用了一些建议的库。
据我了解,我需要将我的初始数据集转换如下:
初始数据集:
需要转为:
此时,我是否只需将该矩阵注入可用库提供的 SVD 算法中,然后(以某种方式)提取结果,还是需要我做更多的工作?
我读过的一些信息:
http://www.netflixprize.com/community/viewtopic.php?id=1043
http://sifter.org/~simon/journal/20061211.html
http://www.slideshare.net/NYCPredictiveAnalytics/building-a -recommendation-engine-an-example-of-a-product-recommendation-engine
http://www.slideshare.net/bmabey/svd-and-the-netflix-dataset-presentation
.. 和其他一些论文
一些库:
LingPipe(java)
Jama(java)
Pyrsvd(python)
任何提示都将不胜感激,尤其是在基本数据集上。非常感谢,奥利
java - 一种“产品”的推荐引擎
我们正在建立的市场允许人们列出他们要出售的东西,但以批量/袋子/盒子的形式出售。我们正在为此建立一个推荐引擎,但那里的大多数文章似乎更适合“销售”大量产品的市场 - 即亚马逊、Netflix 等。因为每个列表都有些独特,所以推荐引擎的最佳方法?有没有相关的文章?
我们知道人们过去购买过的物品。我们知道他们正在寻找的大小或年龄适宜性。
列出的捆绑包具有类别、品牌、尺寸/年龄、颜色和自由格式文本。
有什么想法可以帮助我们开始吗?如果我们的数据存储在 MySQL 中,您认为哪种特定语言最好?
mahout - 如何解决产品推荐问题,例如:用户 __bought__ XXX 也 __viewed__ YYY
我目前正在学习推荐系统,学习了一些关于协同过滤、用户 CF、项目 CF 的知识,很明显使用这些算法来解决以下问题:1)用户买了 XXX 也买了 YYY 2)用户查看了 XXX 也查看了 YYY
我的问题是:如何解决这样的问题:1)用户购买了 XXX 也查看了 YYY 2)用户查看了 XXX 也购买了 YYY ?
更新:刚刚将标题更正为:“用户购买了XXX 也查看了YYY”
recommendation-engine - User Based CF 或 Item Based CF 需要多少数据才能给出推荐?
User CF、Item CF需要多少数据才能给出推荐?
我手动创建了一个小数据集,所以我可以很好地理解算法是如何工作的。
我发现对于我创建的小数据集,Slope-One 可以给出推荐,User CF 或 Item CF 不能给出推荐。
背后的原因是什么?
数据量的阈值是多少?
algorithm - 如何实现这个推荐算法?
我读过的大多数推荐算法文章都集中在用户对项目进行评分的 Netflix 模型上。我想做的略有不同(我认为)。
假设相反,我想创建一个网站,向用户展示两张汽车图片。然后,用户可以选择他们更喜欢哪辆车。用户可以根据自己的喜好多次重复此过程,但希望随着它们的继续,图片会越来越接近用户的喜好。
你将如何实现这个算法?似乎一种可能的方法是简单地实现 ELO 排名算法并将这些结果的顺序用作“评级”,但这具有严重的缺陷,即多个项目无法获得最高评级(用户可能如果有能力对项目本身进行评分,则已完成)。
另一种对我来说似乎更有希望的方法是预先确定每辆车的一般属性(例如颜色、车身类型、2 门 vs 4 门等)并使用这些来大致了解每个用户喜欢的属性并以此为基础提出建议。
algorithm - 如何实现一个房地产推荐引擎?
我说的是电影/物品推荐之类的东西,但房地产似乎更棘手。在访问网站并搜索 RE 时,应该向用户提供一些建议。让我们将任务分为两个任务:
a) 用户还没有输入任何个人信息 - 基于项目的推荐 b) 用户已经输入了他/她的详细信息,例如收入、位置等 - 基于项目/用户的推荐
对于任务 a),我想到的第一件事是开始对 RE 特征进行建模,但使用一些范围而不是精确值。例如:
面积m2
- 40 - 50 我们可以将其标记为“1”
- 50 - 70 是“2”
- ETC ...
价格:
- 20 - 30 千欧元将被标记为 1
- 30 - 40 将是 2
- ETC ...
靠近市中心:
- 1 代表 RE 位于市中心
- 2 区 2 或距中心 2/3 公里
- 3 代表 3 区或距中心 7 公里
因此,拥有范围可以让我们为每个 RE 属性分配一个向量,这将允许我们使用:欧几里德距离、皮尔逊相关和一些最近邻算法。
请评论我的方法或建议一种新方法。