machine-learning - 图论 - 学习成本函数以找到最佳路径

Question

这是一个有监督的学习问题。

我有一个有向无环图（DAG）。每条边都有一个特征向量X，每个节点（顶点）都有一个标签0或1。任务是找到一个代价函数w(X)，使得任意一对节点之间的最短路径具有最高比例1s 到 0s（最小分类错误）。

解决方案必须很好地概括。我尝试了逻辑回归，学习到的逻辑函数可以很好地预测节点的标签，给出传入边缘的特征。但是，该方法没有考虑到图的拓扑结构，因此整个图中的解决方案不是最优的。换句话说，考虑到上述问题设置，逻辑函数不是一个好的权重函数。

虽然我的问题设置不是典型的二元分类问题设置，但这里有一个很好的介绍： http ://en.wikipedia.org/wiki/Supervised_learning#How_supervised_learning_algorithms_work

以下是更多细节：

每个特征向量 X 是一个 d 维实数列表。
每条边都有一个特征向量。也就是说，给定边集 E = {e1, e2, .. en} 和特征向量集 F = {X1, X2 ... Xn}，则边 ei 与向量 Xi 相关联。
可以提出一个函数 f(X)，因此 f(Xi) 给出了边 ei 指向标有 1 的节点的可能性。我上面提到的这个函数的一个例子是通过逻辑找到的回归。然而，正如我上面提到的，这样的功能是非最佳的。

所以问题是：给定图，一个起始节点和一个结束节点，我如何学习最优成本函数 w(X)，使节点 1 与 0 的比率最大化（最小分类错误）？

score 5 · Accepted Answer

这不是一个真正的答案，但我们需要澄清这个问题。不过，我可能稍后会回来寻找可能的答案。

下面是一个示例 DAG。

在此处输入图像描述

假设红色节点是起始节点，黄色节点是结束节点。你如何定义最短路径

1s 与 0s 的最高比率（最小分类错误） ?

编辑：我为每个节点添加名称，并为前两个边缘添加两个示例名称。

在我看来，您无法学习这样一种成本函数，它将特征向量作为输入，其输出（边权重？或其他）可以引导您在考虑图拓扑的情况下采取最短路径前往任何节点。原因如下：

假设您没有您所说的特征向量。给定如上图，如果您想找到与1s 与0s 的比率相关的所有对最短路径，最好使用Bellman 方程或更具体地说是Dijkastra加上适当的启发式函数（例如，1s 在路径）。另一种可能的无模型方法是使用q-learning，其中访问节点获得奖励 +1，访问1节点获得奖励 -1 0。我们一次为每个目标节点学习一个查找 q-table。最后，当所有节点都被视为目标节点时，我们得到了全对最短路径。
现在假设，您神奇地获得了特征向量。既然您能够在没有这些向量的情况下找到最佳解决方案，那么当它们存在时它们如何提供帮助？
有一种可能的情况是，您可以使用特征向量来学习优化边权重的成本函数，即特征向量取决于图拓扑（节点之间的链接以及1s 和0s 的位置）。但是我在您的描述中根本没有看到这种依赖关系。所以我猜它不存在。

score 1 · Accepted Answer

这看起来像是遗传算法具有巨大潜力的问题。如果您将所需的函数定义为例如（但不限于）特征的线性组合（您可以添加二次项，然后是三次项，无限次），那么基因就是系数向量。mutator可以只是一个或多个系数在合理范围内的随机偏移。评估函数只是根据当前突变，所有对的最短路径上 1 与 0 的平均比率。在每一代，挑选最好的少数基因作为祖先，并变异形成下一代。重复直到 ueber 基因在手边。

score 1 · Accepted Answer

我相信您的问题与逆强化学习领域非常接近，您可以在其中对最佳路径进行某些“专家演示”并尝试学习成本函数，以便您的规划器（A* 或某些强化学习代理）输出相同的路径作为专家示范。这种训练是以迭代的方式完成的。我认为在您的情况下，您可以创建专家演示作为通过最大数量的 1 个标记边缘的路径。这是一篇关于同一篇好论文的链接：学习搜索：模仿学习的功能梯度技术。它来自机器人社区，其中运动规划通常设置为图形搜索问题，学习成本函数对于展示所需行为至关重要。

machine-learning - 图论 - 学习成本函数以找到最佳路径

3 回答 3

Related

Reference