在尝试为监督学习问题提出适当的特征时,我有以下想法,并想知道它是否有意义,如果是,如何通过算法制定它。
在图像中,我想对两个区域进行分类,即两种“类型”的像素。假设我有一些有界结构,让我们画一个圆圈,我知道我可以将我的搜索空间限制在这个圆圈内。在那个圆圈内,我想找到一个分割轮廓,即将我的像素分为内部类 A 和外部类 B 的轮廓。
我想实现以下模型:
我知道靠近边界圆的像素更有可能属于外部 B 类。
当然,我可以使用与边界圆的距离作为特征,然后算法将学习内轮廓与边界圆的平均距离。
但是:我想知道我是否可以以更聪明的方式利用我的模型假设。一个启发式的想法是通过这个距离来衡量其他特征,也就是说,如果离边界圆更远的像素想要属于外部 B 类,它必须具有非常令人信服的其他特征。
这导致了一个普遍的问题:
如何利用算法先前单独学习的特征的联合信息?
对于一个特定的问题:
在我概述的设置中,我的启发式想法有意义吗?在算法的哪一点应该使用这些信息?如果我想在文献中搜索类似的想法,推荐的文献或流行语会是什么?