问题标签 [graph-data-science]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neo4j - Neo4j 中用于 GDS 计算的图形生成
我正在处理一个结构类似于以下内容的 CSV 文件:
这里 aId 和 bId 分别对节点 A 和 B 有约束。在最初加载节点和关系时,
有 1490 个标签和 1299 个关系。
现在我希望使用不同的图形数据科学库对文件执行各种计算。为了对此进行投影,我使用CALL gds.graph.create.estimate(['A'],['HAS_SENT'])
返回的 851 个节点和 1299 个关系估计了相同的结果。
但是,当我尝试创建图表时CALL gds.graph.create('mySampleGraph',['A'],['HAS_SENT'])
,它返回了相同数量的节点,但关系为 0。
我错过了什么,我怎么可能得到正确的映射?
neo4j - algo.louvain.stream 为相同的数据返回不同的结果
我正在尝试使用 Neo4j 的 algo.beta.louvain()。我注意到如果我以不同的方式对节点进行排序,它会返回完全不同的结果(每个社区中的社区数和节点数)label
。以下 3 个调用返回不同的结果。我正在使用 {concurrency: 1}。有什么我没有得到的吗?
在同一个 Neo4j 实例中,以上是我注意到的与我的实际问题有关的内容。我真正想做的是为具有相同数据的不同 Neo4j 实例获得一致的结果。在调试不同情况下结果不同的原因时,我注意到我可以通过以不同顺序给出相同的集合节点来重现相关问题。我在原始代码中没有“排序依据”,但我打赌在 Neo4j 的不同实例中,自然排序不同导致结果不同。
python - Neo4j algo.unionFind 与新的图形数据科学库等效
我有一个在 Neo4j 中使用 algo.unionFind 的密码投影。但是,该算法已被弃用。我的查询是:
CALL algo.unionFind('MATCH (n) WHERE n.dtype=\"VALUE\" RETURN id(n) AS id','MATCH p=(n)-[]-(m) WHERE n.dtype=\"VALUE\" AND m.dtype=\"VALUE\" RETURN id(n) AS source, id(m) AS target', {write:true, partitionProperty:\"partition\", graph:'cypher'}) YIELD nodes, setCount, loadMillis, computeMillis, writeMillis
我希望找到一种与 Graph Data Science Library 等效的方法来运行查询并partition
在我的节点中写入一个新属性。
任何帮助将不胜感激!
neo4j - 在 Neo4j 中将参数传递给 gds.create.graph
如何在 Neo4j 中将参数传递给 gds.create.graph?例如,这个查询有什么问题?(我使用py2neo)
graph - 是否有任何代码可用于图拓扑固定的时间图网络?
我一直在尝试为图分类问题实现时间图神经网络,其中只有两个类,其中只有节点特征随时间演变。我的图是一个完整的图,只有几个节点。我来自非编程背景,并且很长时间以来一直在同一页面上。我正在参考论文“Temporal graph network for deep learning on dynamic graphs”。请有人帮我找到与此问题相关的代码或一些读数。
neo4j - 在图投影的子集上运行 allShortestPaths
我正在使用gds.alpha.allShortestPaths.stream()
图形投影。
我想在具有特定属性值的节点子集上运行该算法,但文档说 allShortestPaths 算法只接受图形投影作为输入。我认为在整个图形投影上运行算法是不可能的,因为它由大约 1500 万个节点组成。
我会喜欢这样的东西,我可以完全绕过图形投影部分:
database - 存储大型且不断增长的图形的最佳数据库是什么?
我有一个名为关系的PostgreSQL用户和关注者表,其大小为 2 亿行,并且它以每周 1000 万新用户和他们之间的新关系的速度增长。我已经在列上设置了索引,并且我需要每对用户和关注者都是唯一的。一个用户的最大关注者数量是 5000,用户查询是针对两个方向的,例如:
关于
关注者时间的用户
:一个简单的查询,比如在我的系统中需要 10 秒,我需要等待半小时才能执行之前提到的查询。
SELECT users, followers FROM relations WHERE users NOT IN (1,2,3);
SELECT users, followers FROM relations WHERE followers NOT IN (1,2,3);
SELECT COUNT(*) FROM relations;
存储此图的最佳数据库是什么(高写入率和高读取率)
java - 具有图形数据科学的嵌入式 Neo4j - BFS 过程似乎缺失
此处的文档https://neo4j.com/docs/graph-data-science/1.1/algorithms/bfs/#algorithms-bfs描述了可调用的“gds.alpha.bfs.stream”。
为了调用它,据我所知,它需要在嵌入式数据库中注册。类似的东西
否则 neo4j 会抛出一个异常,通知我们我们的错误行为:
没有
gds.alpha.bfs.stream
为此数据库实例注册的名称的过程。请确保您正确拼写了过程名称并且该过程已正确部署。
但是,我似乎找不到任何要包含在 BFS 或 BreadthFirstSearch 中的 *Proc.class。
该文档不正确吗?我需要一个不同的 jar 来使用描述的 bfs 算法吗?
OT:我链接到旧版本的文档,因为它支持遍历关系的 maxCost 条件。较新的版本缺少此功能(实际上似乎也没有BFSProc)
emacs - 为 Emacs 滚动你自己的图形数据库
我正在考虑一个 Emacs 应用程序,它将为 org-mode 提供基本的图形数据库功能。我想自己编写代码,一个滚动你自己的图形数据应用程序。任何人都可以指导我进行此类工作的数据结构和算法吗?我对图论知之甚少,只是基础知识。对于我的努力,我想将 org-mode 标题存储在单个 org-mode 文件中作为顶点,但也可以选择将整个 org-mode 文件存储为单个顶点。每个文件,每个标题顶点在 org-mode PROPERTIES “抽屉”中都会有一个唯一的 UUID 编号,可以理解为每个标题的结构。边缘可能是 RFD 式的——本质上是用作边缘的“谓词”顶点。做一个疯狂的猜测,我' d 说图存储为邻接列表而不是邻接矩阵?某种形式的查询也应该是可能的。
任何建议表示赞赏。
python - 我应该使用哪种聚类算法和数据可视化工具来定位和可视化地理天气数据
我正在努力寻找与天气相关的数据中的统计异常值。更具体地说,我有在特定时间记录温度的 10000 个数据点的温度和位置(经度和纬度)。什么是定位与地理天气相关的异常值并以异常值显着可见的方式可视化数据的最佳方法。对于可视化部分,python 工具将是最受赞赏的,而定位异常值部分的算法或技术将是最有用的。(我在考虑集群)