问题标签 [knowledge-graph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dataset - 如何在特定的知识图中为 TransE 算法构建我自己的数据集
现在我正在建立一个中国股票的知识图谱,并想建立一个新闻推荐系统。我想使用 TransE 算法进行实体嵌入和关系嵌入。但是我没有数据集,也不清楚如何使用自己的知识图谱构建数据集?
python - 如何在 Tensorflow 中按主题在知识图中获取三元组?
我正在研究一个知识图数据集,它具有格式的三元组,即主语、谓语和宾语的三元组。
比如说,知识图如下所示:
在损失函数中,它迭代每个三元组:
(在哪里:
)
现在,对于每个三元组,我希望从知识图中获取与所讨论的三元组具有相同主题的所有三元组。例如:对于三元组 (a,y,b),我希望获取 ((a,y,c),(a,y,d))。[注:不包括被评估的三元组]。
我已经使用 numpy 列表执行了这个操作,通过为知识图创建一个字典数据结构,如下所示:
这将返回格式的字典:
然后,我对任何三元组进行简单的查找,如下所示:
x_to_score
正在评估的三元组在哪里。
例如,这将返回[('a','y','c'), ('a','y','d')]
样本三元组 ('a','y','b') 的列表。
但是,现在的问题是,当我遍历三元组(即一次性处理一批三元组)时,它们需要作为张量传递,因此我不能执行 numpy 操作或列表推导来做到这一点。
我需要处理要作为张量评估的三元组,然后也返回结果的张量列表。
由于我是 tensorflow 的新手,所以我无法弄清楚如何去做。
此外,这需要用于评估一批三元组。
我已经尝试过tf.slice()
获取主题的操作和一些tf.sets()
功能,但无法弄清楚,因为我对 tensorflow 很陌生。
任何帮助将不胜感激!谢谢你。
python - 如何编写将三元组 ['a','b','c'] 转换为单个字符串“abc”的函数。
我需要一些帮助来完成下周一的家庭作业。我是编程初学者,我的任务是编写一个函数,将 ['a','b','c'] 之类的字符串转换为“ab c”之类的字符串。
我已经尝试了一段时间,但我似乎无法弄清楚。如果有人可以帮助我并向我展示我的错误是什么以及需要改进的地方,我将非常感激!
这是我必须改造的:
这是我到目前为止的代码:
结果应该是这样的:
然而,这些是我得到的结果:
我真的希望这足够清楚,并提前非常感谢您的帮助!
neo4j - 使用 Neo4j 为我的数据库构建和扩展具有实体提取的知识图
我的目标是构建一个自动化的知识图谱。我决定使用 Neo4j 作为我的数据库。我打算将一个 json 文件从我的本地目录加载到 Neo4j。我将使用的数据是 yelp 数据集(json 文件非常大)。
我看过一些带有 Graphaware 和 OpenNLP 的 Neo4j 示例。我读到 Neo4j 对 JAVA 应用程序有很好的支持。我还读到 Neoj 支持 python(我打算使用 nltk)。是否建议将 Neo4j 与 JAVA maven/gradle 和 OpenNLP 一起使用?或者我应该将它与带有 nltk 的 py2neo 一起使用。
我真的很抱歉我之前没有使用这些工具的任何经验。任何意见或建议将不胜感激。太感谢了!
computer-science - 是否可以在本体中使用“and”、“or”、“not”作为关系/谓词?为了表示因果关系?
如果我们使用本体,我们可以使用<s,p,o>
语义三元组来表示许多事物。
我想知道如何表示这一点:
A和B导致C
或者
A 或 B 导致 C
?
我不想做推理,我只想代表。
是否可以在本体中使用和,或否定作为谓词/关系?
合取、析取和蕴涵具有适当的逻辑意义。
我只看到研究人员使用因果网络来表示因果关系,但我想知道为什么这在本体中是不可能的。
提前致谢,
python - 如何从新文章中提取犯罪人的姓名?
我可以使用 Spacy NER 模型提取人名,但它包括律师/警察/或其他所有人。我的问题是提取被告/定罪/或犯罪的人的姓名关于新闻文章。
安卡拉:国有的阿纳多卢通讯社说,土耳其法院周一下令保释一名前反对派议员,而他正在接受与恐怖主义有关的指控的审判。
Eren Erdem 在 2018 年中期选举中失去席位,授予总统塔伊普·埃尔多安 (Tayyip Erdogan) 新权力,自 6 月以来一直被判入狱,并被指控在 2014 年担任反对派报纸编辑期间发布非法窃听。
他否认协助美国神职人员 Fethullah Gulen 的追随者的指控,后者被指控策划了 2016 年失败的政变。
Eren Erdem 是主要被告,我只需要这个名字,但 Spacy 模型提取了所有人的名字 Tayyip Erdogan(总统) Fethullah Gulen Enis Berberoglu Tuvan Gumrukcu 等
我需要罪犯的名字,而不是总统或警察。
我们可以使用 Python/NER 来实现吗?
编辑:我们可以在这里应用知识图概念吗?我对此进行了很多探索,但找不到关于该案例的令人信服的文章。如果有人可以绕过这个概念或提供文章链接(相关),那就太好了。
rdf - 对 RDF 知识图感到困惑
我有一个关于信息检索硕士课程的演讲主题的问题。我演讲的主题是关于“RDF 知识图谱”。我想问一下普通/基本知识图和RDF图有区别吗?谁能给我写一个简短的解释?
PS:我是这个话题的新手
entity - hits@k 是如何计算的,在知识库中的链接预测上下文中意味着什么
我研究有关知识网络中链接预测的论文。作者通常报告“Hits@k”。我想知道如何计算 hits@k 以及它对模型和结果意味着什么?
rdf - 为什么在 RDF 中为对象使用代码而不是字符串?
例如:
或者这样的格式:
在任何一种情况下,f06574
andtt0268252
都是代码,而不是实体或实例的实际字符串。一个原因可能是同一个字符串可能指代不同的事物,但在 RDF 世界中,事物的标识符总是以其唯一的 URI 为前缀,因此即使使用字符串,也不会引起歧义,等等可读且不透明的代码。
这种表现的真正原因是什么?Freebase 中的三元组是相似的。