我正在尝试将对象之间的关系用于监督学习任务。例如,给定一个像“Cats eat fish”这样的文本,我想使用关系 Cats-eat-fish 作为学习任务的特征(即识别词义)。因此,我想用数字表示这种关系,以便我可以将其用作学习模型的特征。关于我如何做到这一点的任何建议。我正在考虑将其散列为一个整数,但这可能会带来挑战,例如语义上相同的两个关系可能具有 2 个非常不同的散列值。理想情况下,我希望 2 个相似的关系(例如生活和居住)散列到相同的值。我想我还需要弄清楚是否可以在散列之前规范化关系。
其他可能不使用数字特征的方法也很有用。我也想知道是否有基于图形的方法来解决这个问题。