1

我有以下 csv 文件:

一个与人员有关,另一个与地址有关,另一个与人员地址连接(每个文件加标题一行)。出于第一次运行的测试目的,我有:

配置 create_schema: true, load_new: true, load_threads: 3

顶点和边的导入是成功的。(两个顶点和它们之间的一条边)

现在,当我运行相同的脚本(相同的数据,相同的输入脚本)但使用不同的配置时

配置 create_schema: false, load_new: false, load_threads: 3

似乎节点没有改变,但我有一个重复的节点边缘。(相同节点之间的两个顶点和两条边)

这是我运行的代码:

inputfiledir = 'data/'
personInput = File.csv(inputfiledir + 'sna_person_test.csv').delimiter(',')
addressInput = File.csv(inputfiledir + 'sna_address_test.csv').delimiter(',')
personAddressInput = File.csv(inputfiledir + 'san_person_address_test.csv').delimiter(',')

load(personInput).asVertices {
    label "person"
    key "id"
}

load(addressInput).asVertices {
    label "address"
    key "id"
}

load(personAddressInput).asEdges {
    label "has_address"
    outV "person_id", {
        label "person"
        key "id"
    }
    inV "address_id", {
        label "address"
        key "id"
    }
}

有没有办法避免这种情况?

谢谢

4

1 回答 1

1

这是由于边没有 ID,这导致 Graph Loader 无法确定边是否实际上是重复的。这将导致后续加载复制边,但不复制顶点。

于 2016-08-17T18:53:09.573 回答