0

我们正在使用 Talend Open Studio for Big Data 将 MySQL 数据迁移到 Neo4j。我已经完成了一些工作,但是我在 rels.csv 文件中使用 tNeo4jOutputRelationship 组件时遇到了困难,该文件包含我们的 nodes.csv 文件中不存在的值之间的关系。

抛出的显式错误:

Exception in component tNeo4jOutputRelationship_1

    java.lang.RuntimeException: Start node looked up by index with my_index as key and my_value as value doesn't exist

做了一些研究,发现在Github上抛出错误的代码部分

是否可以在运行时暂时抑制此错误?我们确实有相当多的重组数据,并不是每个 rels.csv 都会与每个作业的 nodes.csv 匹配。

4

1 回答 1

2

我看到的最简单的方法是使用您在 MySQL 中的 ID 创建 nodes.csv 文件,或者在从 MySQL 导出到 nodes.csv 时为节点生成 ID。

然后,在使用 tNeo4jOutput 创建节点时,您还可以为从 MySQL 数据中获得的 ID 创建一个索引。 在节点 ID 上创建索引

下一步是在 MySQL 中为关系创建表示并导出到 CSV。这将具有应该连接的节点的开始和结束 ID。 定义关系的 id

然后,当使用 tNeo4jOutputRelationship 组件时,您可以指定用于查找 ID 的索引,并从 relationship.csv 文件中指定开始和结束 ID。 使用预定义的 ID 创建关系

于 2013-10-16T12:44:34.063 回答