似乎我有一个非常常见的任务,但是我缺少一些可以帮助我查找信息的关键字。所以我陈述我的任务。
有人。关于每个人的一组变量是已知的。一对人 P1 和 P2 可以处于以下关系之一(它们是类):
- 亲子
- 兄弟姐妹
- 合作伙伴(重要的)
- 其他(一些间接亲属或非家庭成员)
通过选择具有已知关系的对(Pi,Pk)的一些变量,我可以训练一个朴素贝叶斯分类器来预测类。这很好。
现在。我有一组人 P1、P2、... Pm,我需要构建代表家谱的最可能图。我可以成对使用我的贝叶斯分类器,但在这种情况下,我不会使用存储在图形/多个节点组合中的大量信息。
例如,给出了节点 P1、P2、P3 和 P4。我的贝叶斯分类器认为 P2 是 P1 的父级,P4 是 P3 的父级的概率为 0.9。至于 P1 和 P3 之间的关系,它返回兄弟姐妹的 p=0.31 和伙伴的 p=0.34,所以结果是相当不可靠的。现在,如果 P2 和 P4 之间关系的分类产生“伙伴”的概率为 0.7,我可以更确定 P1 和 P3 实际上是兄弟姐妹。另一方面,如果 P2 和 P4 是概率为 0.8 的“其他”,那么我可以更安全地得出结论 P1 和 P3 是合作伙伴。
我可以手动编写这个逻辑,但我认为有更多的案例和逻辑依赖关系,特别是如果我们想为大约 10 或 20 人构建关系图。因此,我想使用某种分类器或分类器系统。
但是这个分类器系统的输出将不是一个二进制或标量值,而是一个整图。我可以使用什么或从哪里开始寻找?
谢谢!