r - 用于价格优化的多臂老虎机分析

Question

最近，我阅读了一篇名为 Bandits Know the Best Product Price 的博客文章（http://pkghosh.wordpress.com/2013/08/25/bandits-know-the-best-product-price/），其中概述了如何使用多臂老虎机分析进行价格优化。

关于多臂老虎机分析是否优于 A/B 测试也有很多讨论（例如“20 行代码，每次都会击败 A/B 测试”：http ://stevehanov.ca/blog/index .php?id=132?utm_medium=referral与“为什么多臂老虎机算法并不比 A/B 测试‘更好’”：http: //visualwebsiteoptimizer.com/split-testing-blog/multi-armed-bandit-算法/）。

我知道有一个名为“bandit”的 R 包，可用于此类分析。

是否有人有一个玩具示例 -与博客文章中的示例相当 - 它显示了如何使用 R 应用此方法（在价格优化的背景下）？

谢谢你的帮助。

score 4 · Accepted Answer

我最近在做一个关于强盗算法的项目。基本上，老虎机算法的性能很大程度上取决于数据集。它非常适合使用不断变化的数据进行连续测试。所以你需要做什么来测试和调整你的模型测试数据。

想要更深入地了解bandit，可以阅读本书，网站优化的bandit算法：http: //shop.oreilly.com/product/0636920027393.do。它很好地解释了基本的老虎机算法并在 Python 中实现。你可以在 Github 中找到它的代码：https ://github.com/johnmyleswhite/BanditsBook 。然而，他们并没有在书中谈论上下文强盗。

对于 R，我不确定。但是我刚刚在网上搜索，我发现一个人在R中实现了bandits，代码如下：https ://github.com/lotze/bandit

希望它可以帮助你。

score 3 · Accepted Answer

我对这个话题的谨慎探索可能对你有用： http ://codeandmath.wordpress.com/2014/04/05/type-i-error-in-bandits/

score 0 · Accepted Answer

我了解您要求 R 中的代码，但实现通常非常简单。我认为这可能是相关的。如果您将二进制数据替换为连续的，则该算法有效，因为奖励只是平均值。因此，请随意使用相同的数据（如价格）并替换（带有一些随机数的数据）。

r - 用于价格优化的多臂老虎机分析

3 回答 3

Related

Reference