1

我开始的是来自荷兰的邮政编码表。我将其拆分为几个 csv 文件,例如包含城市作为主语、PartOf 作为谓词和自治市作为宾语。这会在一个文件中为您提供:

city,PartOf,municipality
Meppel,PartOf,Meppel
Nijeveen,PartOf,Meppel
Rogat,PartOf,Meppel

现在我想把这些数据输入 MarkLogic。我可以导入 csv 文件,我可以导入三元组,但我无法弄清楚组合。

4

2 回答 2

1

我建议稍微重写它,使其符合N-Triples格式,为其提供 .nt 扩展名,然后使用 MLCP 将其加载为 input_type rdf。

于 2016-02-11T15:59:29.160 回答
0

您可以使用Google Refine将 CSV 数据转换为 RDF。之后,可以使用 MLCP 推送该数据。你可以做这样的事情 -

$ mlcp.sh import -username user -password password -host localhost \
    -port 8000 -input_file_path /my/data -mode local \
    -input_file_type rdf 

有关使用 MLCP 加载三元组的更多信息,您可以参考这个 MarkLogic 社区页面

于 2016-05-04T03:10:19.723 回答