7

最近,我阅读了一篇名为 Bandits Know the Best Product Price 的博客文章(http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/),其中概述了如何使用多臂老虎机分析进行价格优化。

关于多臂老虎机分析是否优于 A/B 测试也有很多讨论(例如“20 行代码,每次都会击败 A/B 测试”:http ://stevehanov.ca/blog/index .php?id=132?utm_medium=referral与“为什么多臂老虎机算法并不比 A/B 测试‘更好’”:http: //visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-算法/)。

我知道有一个名为“bandit”的 R 包,可用于此类分析。

是否有人有一个玩具示例 -与博客文章中的示例相当 - 它显示了如何使用 R 应用此方法(在价格优化的背景下)?

谢谢你的帮助。

4

3 回答 3

4

我最近在做一个关于强盗算法的项目。基本上,老虎机算法的性能很大程度上取决于数据集。它非常适合使用不断变化的数据进行连续测试。所以你需要做什么来测试和调整你的模型测试数据。

想要更深入地了解bandit,可以阅读本书,网站优化的bandit算法:http: //shop.oreilly.com/product/0636920027393.do。它很好地解释了基本的老虎机算法并在 Python 中实现。你可以在 Github 中找到它的代码:https ://github.com/johnmyleswhite/BanditsBook 。然而,他们并没有在书中谈论上下文强盗。

对于 R,我不确定。但是我刚刚在网上搜索,我发现一个人在R中实现了bandits,代码如下:https ://github.com/lotze/bandit

希望它可以帮助你。

于 2014-03-04T14:36:17.643 回答
3

我对这个话题的谨慎探索可能对你有用: http ://codeandmath.wordpress.com/2014/04/05/type-i-error-in-bandits/

于 2014-04-05T07:00:05.547 回答
0

我了解您要求 R 中的代码,但实现通常非常简单。我认为可能是相关的。如果您将二进制数据替换为连续的,则该算法有效,因为奖励只是平均值。因此,请随意使用相同的数据(如价格)并替换(带有一些随机数的数据)。

于 2020-08-10T20:50:50.680 回答