这是一个有监督的学习问题。
我有一个有向无环图(DAG)。每条边都有一个特征向量X,每个节点(顶点)都有一个标签0或1。任务是找到一个代价函数w(X),使得任意一对节点之间的最短路径具有最高比例1s 到 0s(最小分类错误)。
解决方案必须很好地概括。我尝试了逻辑回归,学习到的逻辑函数可以很好地预测节点的标签,给出传入边缘的特征。但是,该方法没有考虑到图的拓扑结构,因此整个图中的解决方案不是最优的。换句话说,考虑到上述问题设置,逻辑函数不是一个好的权重函数。
虽然我的问题设置不是典型的二元分类问题设置,但这里有一个很好的介绍: http ://en.wikipedia.org/wiki/Supervised_learning#How_supervised_learning_algorithms_work
以下是更多细节:
- 每个特征向量 X 是一个 d 维实数列表。
- 每条边都有一个特征向量。也就是说,给定边集 E = {e1, e2, .. en} 和特征向量集 F = {X1, X2 ... Xn},则边 ei 与向量 Xi 相关联。
- 可以提出一个函数 f(X),因此 f(Xi) 给出了边 ei 指向标有 1 的节点的可能性。我上面提到的这个函数的一个例子是通过逻辑找到的回归。然而,正如我上面提到的,这样的功能是非最佳的。
所以问题是:给定图,一个起始节点和一个结束节点,我如何学习最优成本函数 w(X),使节点 1 与 0 的比率最大化(最小分类错误)?