我是机器学习的新手,我正在尝试实现知识图并将其用于搜索目的(就像 Google 和 Bing 一样)。这是我的方法。我有一些文本文件。我对python很熟悉。
脚步:
- 从文本文档中提取三元组。我正在考虑为此使用斯坦福 OpenIE。(有没有更好的可用于 python 的库?)。
提取三元组并将它们加载到 csv 中后,我的数据如下所示:
Subject relation predicate
New Delhi IS_CAPITAL India
India Gate IS_LOCATED New Delhi
India HAS_STATES 29
Hyderabad IS_CAPITAL Telangana
Charminar IS_LOCATED Telangana
2. 将数据集导入 python 并根据TransH、TransE、ComplEx等任何模型对其进行训练。 3.然后使用Tensorflow和Ampligraph库(Ampligraph 示例)对其进行训练。
现在,一旦我获得了嵌入式模型,我该如何使用它来回答搜索查询?我如何将我的模型存储在数据库中,为此我应该使用什么数据库?
谢谢你。
附言。您可以访问“Ampligraph Example”的链接,了解训练后生成什么样的模型。