问题标签 [knowledge-graph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vaticle-typedb - 使用 grakn / graql 在知识图中插入属性的属性
我的 KG 包含具有属性的关系类型的实例。
我想插入新的属性值,但现在链接到那些关系中已经存在的属性(属性的属性)。
考虑一个虚构的例子,首先我会插入关系:
之后,假设我想插入一个新属性,invoice-date "2020-06-14"
作为invoice "aei379"
.
我应该如何编写属性匹配invoice "aei379"
和新属性插入的查询invoice-date "2020-06-14"
?
是否有必要匹配特定的关系(在我的示例中,可以有多个具有相同属性的关系)还是可以直接匹配invoice
属性?
google-cloud-platform - JanusGraph 大规模数据摄取
我们正在使用 python 在 Kubernetes (GCP) 上的 Janusgraph 中摄取数据。我们正在做多线程、节点链接、索引,但我们仍然能够在 60 分钟内从 bigquery 中提取 100k(节点)记录。
Kubernetes 规范 - 1 个 Pod,具有 25 个 vCPU 和 150 GiB RAM ids.block-size = 1000 万线程池 - 16 个节点池 - 16 个堆大小 - 4 gb
问题:
我们可以采取任何其他方法来提高摄取性能,从而减少总体时间。
我们可以通过 Python 驱动程序使用 Janusgraph 一次创建多少个多个连接。目前我们能够创建 30 个线程(连接),但是当我们增加线程数时,连接要么卡住,要么性能下降。
任何细节/帮助将不胜感激
Gremlin 查询:gV().hasLabel("http://purl.uniprot.org/core/Helix_Annotation").has("id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45") .has("node_id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").has("rdf_type", "http://purl.uniprot.org/uniprot/").has( "http://purl.uniprot.org/core/range", "http://purl.uniprot.org/range/22571007582875950tt125tt127").fold().coalesce(unfold(), addV("http:// purl.uniprot.org/core/Helix_Annotation").property("id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").property("node_id", "http://purl. uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").property("rdf_type", "http://purl.uniprot.org/uniprot/").property("http://purl.uniprot.org/core/range", "http://purl.uniprot.org/range/22571007582875950tt125tt127")).V().hasLabel("http://www.w3.org/1999/ 02/22-rdf-syntax-ns#Statement").has("id", "http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7").has("node_id", "http ://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7").has("rdf_type", "http://purl.uniprot.org/uniprot/").has("http://purl .uniprot.org/core/attribution", "http://purl.uniprot.org/uniprot/P06931#attribution-AE0E09C5B47CC2714C9061D3806995B4").fold().coalesce(unfold(), addV("http://www. w3.org/1999/02/22-rdf-syntax-ns#Statement").property("id", "http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7")。属性(“node_id”,“http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7”).property(“rdf_type”,“http://purl.uniprot.org/uniprot/”)。属性(“http://purl.uniprot.org/core/attribution”,“http://purl.uniprot.org/uniprot/P06931#attribution-AE0E09C5B47CC2714C9061D3806995B4”))
graph - 知识子图嵌入和知识子图神经网络
我对两件事感兴趣:
- 首先,如果最终我想从某些子图?
任务应如下所示: NN:
-输入:知识子图
-输出:实际价值
输入具体应该怎么看?神经网络能像这样处理大数据吗?我应该使用哪个神经网络?
- 其次,因为我知道应该有一些子图嵌入会创建子图的小表示(不是节点嵌入,而是图嵌入),是否有一些有用的方法能够嵌入知识子图,以便它们可以作为输入提供在神经网络?
也欢迎具有不同类型关系的其他类似有向图的解决方案。
sparql - 是否可以在 SPARQL/Update 中使用 GROUP BY 子句执行 INSERT 操作?
假设我有一个包含三个不同年级学生的图表。
示例图:
我想为班级Grade的每个实例创建一个名为GradeStrength的属性,以存储该年级的学生人数。
对于上面的例子,它看起来像:
目前我使用以下两个单独的查询来执行此操作 -
- 在图表上运行 SELECT + GROUP BY 查询以获取每个年级的计数
- 遍历 1. 的结果行以创建一串三元组
- 在图上运行 INSERT DATA 更新查询
如何通过使用 INSERT 和 GROUP BY 构造的单个 SPARQL/Update 查询来实现这一点?我尝试编写这样的查询,但在 Blazegraph 中失败了。
python - 如何通过一些三元组数据创建 RDF 文件?
我的意思是如果我有很多三元组数据,例如“h1 r1 t1/ h1 r2 t2/ ......”,它们存储在 txt 文件中。如何使用 txt 文件作为输入来创建 RDF 文件?我想使用 SPARQL 来查询这个三元组数据。
wikipedia - 如何下载和使用维基百科数据转储?
我想计算特定语言的 wiki 转储中的实体/类别,比如英语。对于初学者来说,官方文档很难找到/遵循。到目前为止,我所了解的是,我可以下载一个 XML 转储(从所有可用的不同文件中下载什么),并解析它(?)以计算实体(文章主题)和类别。
这些信息,如果有的话,很难找到。请提供一些关于如何使用它或我可以了解它的资源的说明。
谢谢!
neo4j - 将自然语言转换为密码查询
我正在使用 neo4j 创建电子邮件中实体之间关系的知识图。我现在需要将自然语言搜索查询转换为密码查询。我一直无法找到与此相关的任何具体内容。我该如何进行?
python - 如何使用来自 azure 认知搜索索引的数据创建知识图,使用在 JFK 文件演示中生成的类似 python 的图
我已经在 azure 认知搜索中索引了一组非结构化文档(.docx)。
现在我需要创建知识图来定义使用 python 索引的文档之间的依赖关系。
我参考了JFK 文件,在那里我可以看到由 JFK 文档中的术语之间的依赖关系生成的图表。我在这里附上了图片。
我想在 python 的帮助下创建与它相同的东西。
我不知道如何从 azure index 中提取数据并从提取的数据中创建图表。
请帮我。先感谢您
graph-databases - GRAQL 中的递归查询?
有没有办法在 GRAQL 中定义递归查询,即匹配实体之间的确切谓词路径未知的模式(例如,它们中有多少)?
SPARQL 在 1.1 版本中增加了对这些的支持。来自Apache Jena 文档的示例:
CYPHER 从一开始也允许它们。例子:
是否可以在 GRAQL 中做类似的事情?
google-knowledge-graph - 用于收集 PASF 结果的知识图 API
我正在尝试收集类似于我们通过知识图 API 从谷歌搜索中获得的 PASF 结果
示例:https ://www.google.com/search?q=donald+trump&kponly&kgmid=/m/0cqt90
当我们点击 PASF 结果时,你会得到这个 URL:
我需要的只是结果的名称、kgid、图像。
就像我查询特朗普时一样,我得到乔·拜登、鲍里斯·约翰逊和前 10 位偶像以及他们的姓名、图片和体重 ID
我认为知识图可以帮助我。但是,我没有成功获得 PASF 结果。
任何人都可以帮助我吗?或引导我查看我只能读取和获取 PASF 数据的文档
谢谢拉姆