artificial-intelligence - ai：确定运行哪些测试以获得最有用的数据

Question

我有一个系统（有关详细信息，请参见网站上的页面），其中：

我需要一种算法来确定哪些特征（站点）最有可能具有高 ROI 进行查询（即更好地区分目前看来合理的类别 [用户]，并增加确定它是任何给定的类别）。

这需要平衡开发（基于先前的测试数据的测试）和探索（测试的东西没有经过足够的测试来了解它的性能）。

还有一个关于先验排名的问题。这一个专门关于基于迄今为止收集的结果的后验排名。

现在，我没有足够的数据来测试任何其他人曾经受到打击的所有东西，但最终情况并非如此，此时需要解决这个问题。

我想这是 AI 中一个相当标准的问题——对于要进行的昂贵查询有一个廉价的启发式方法——但我的 AI 课程没有涵盖它，所以我实际上不知道是否有标准答案。因此，数学不太重的相关阅读以及对特定算法的建议会有所帮助。

解决这个问题的好方法是什么？

score 0 · Accepted Answer

如果您对尚未采样的特征一无所知，那么在决定是探索还是利用您的数据时，您几乎没有什么可做的。如果您可以在每个查询之后将您的 ROI 表示为一个数字，那么通过跟踪置信上限来做出此选择的最佳方法。请参阅论文《多臂强盗问题的有限时间分析》。

1 回答 1