我开始的是来自荷兰的邮政编码表。我将其拆分为几个 csv 文件,例如包含城市作为主语、PartOf 作为谓词和自治市作为宾语。这会在一个文件中为您提供:
city,PartOf,municipality
Meppel,PartOf,Meppel
Nijeveen,PartOf,Meppel
Rogat,PartOf,Meppel
现在我想把这些数据输入 MarkLogic。我可以导入 csv 文件,我可以导入三元组,但我无法弄清楚组合。
我开始的是来自荷兰的邮政编码表。我将其拆分为几个 csv 文件,例如包含城市作为主语、PartOf 作为谓词和自治市作为宾语。这会在一个文件中为您提供:
city,PartOf,municipality
Meppel,PartOf,Meppel
Nijeveen,PartOf,Meppel
Rogat,PartOf,Meppel
现在我想把这些数据输入 MarkLogic。我可以导入 csv 文件,我可以导入三元组,但我无法弄清楚组合。
我建议稍微重写它,使其符合N-Triples格式,为其提供 .nt 扩展名,然后使用 MLCP 将其加载为 input_type rdf。
!
您可以使用Google Refine将 CSV 数据转换为 RDF。之后,可以使用 MLCP 推送该数据。你可以做这样的事情 -
$ mlcp.sh import -username user -password password -host localhost \
-port 8000 -input_file_path /my/data -mode local \
-input_file_type rdf
有关使用 MLCP 加载三元组的更多信息,您可以参考这个 MarkLogic 社区页面