datastax - Dse Graph loader 重复边

Question

我有以下 csv 文件：

一个与人员有关，另一个与地址有关，另一个与人员地址连接（每个文件加标题一行）。出于第一次运行的测试目的，我有：

配置 create_schema: true, load_new: true, load_threads: 3

顶点和边的导入是成功的。（两个顶点和它们之间的一条边）

现在，当我运行相同的脚本（相同的数据，相同的输入脚本）但使用不同的配置时

配置 create_schema: false, load_new: false, load_threads: 3

似乎节点没有改变，但我有一个重复的节点边缘。（相同节点之间的两个顶点和两条边）

这是我运行的代码：

inputfiledir = 'data/'
personInput = File.csv(inputfiledir + 'sna_person_test.csv').delimiter(',')
addressInput = File.csv(inputfiledir + 'sna_address_test.csv').delimiter(',')
personAddressInput = File.csv(inputfiledir + 'san_person_address_test.csv').delimiter(',')

load(personInput).asVertices {
    label "person"
    key "id"
}

load(addressInput).asVertices {
    label "address"
    key "id"
}

load(personAddressInput).asEdges {
    label "has_address"
    outV "person_id", {
        label "person"
        key "id"
    }
    inV "address_id", {
        label "address"
        key "id"
    }
}

有没有办法避免这种情况？

谢谢

score 1 · Accepted Answer

这是由于边没有 ID，这导致 Graph Loader 无法确定边是否实际上是重复的。这将导致后续加载复制边，但不复制顶点。

datastax - Dse Graph loader 重复边

1 回答 1

Related

Reference