0

我一直在尝试使用 mlcp 脚本加载 RDF 数据集,由 2091 个 nquad 组成,总共代表 727Mio 三元组。到目前为止,我已经使用了这个命令:

$ mlcp.sh import -username <myusername> -password <mypwd> -host localhost -  port 8000 -input_file_path /home/to/path/ -output_override_graph http://mynamedgraph -mode local -input_file_type rdf

我在 3205 秒后得到的错误如下:“XDMP-FORESTERR:森林文档合并错误:SVC-FILWRT:文件写入错误:写入'/var/opt/MarkLogic/Forests/Documents/00000101/TreeData':否设备上的剩余空间”(此处为详细信息 [1])。但是,我的磁盘中仍然有足够的空间(剩余 28G)。

命令中奇怪的是我看不到在哪里传递数据集名称。

请问,我做错了什么?

TIA [1] https://gist.githubusercontent.com/gatemezing/3dce218a98ae72d2a1b8d3219ecd1fa1/raw/76144ee9740e1ba6f79eb114b9907bbe2ac59a03/mlcp.log

4

1 回答 1

1

如果您的合并最大大小设置为默认的 32Gb,而您只有 28Gb,那么它可能会尝试完成合并并且没有足够的空间。此外,如果您在合并失败后检查磁盘空间,则它已经从合并中清除了文件。

重要的是要记住,合并是作为单个事务处理的,如果它在事务中用完空间,它将回滚并且在事务期间创建的文件将被删除。

MarkLogic 建议有足够的可用空间来容纳合并,通常比您的数据库大 50% 左右。

于 2017-02-28T16:40:04.053 回答