0

我有这种形式的数据:

[(v1, A1, B1), (v2, A2, B2), (v3, A3, B3), ...]

vs 对应于数据元素,sABs 对应于表征 s 的数值v

查看此数据的人可以查看它并根据AB值查看哪个元组看起来是最佳“匹配”。我想要一种 AI 形式,我可以通过选择其中一个元组作为最佳来进行训练,并且可以调整赋予A和的权重B

基本上,每个元组代表一个值的近似值。A表示一个误差并B表示每个近似值的复杂度。我希望通过为它们分配不同的权重来在错误和复杂性之间做出一些妥协。我想用不同值的近似值进行几次试验,然后选择我认为看起来最好的一个,并让 AI 相应地调整权重。

4

1 回答 1

1

您所描述的也称为模型选择问题,这是机器学习和统计中经常遇到的问题。您基本上有一些模型可以通过某种优度(通常测量为错误或对数似然度)来拟合您的数据,并且这些模型具有一些复杂性测量(通常是模型中的参数数量)。您想选择最佳拟合模型并惩罚其复杂性,因为这可能是过度拟合的标志。

通常,过度拟合对您的影响程度取决于数据的大小。但是有一些措施明确允许您权衡模型的适应度和复杂性:

如上所述,根据您的数据选择模型会使模型选择偏向于数据。因此,这通常使用验证集完成,然后在测试集上进行评估

我不知道你用算法解决这个问题的方法是否很好。通常它取决于您的数据和一定程度的直觉。在我看来,您描述的元机器学习技术可能不会太可靠。最好先从一些更有原则和更简单的想法开始。

于 2013-03-23T04:57:11.060 回答