java - 如何做多个添加操作apache jena tdb

Question

我必须为来自 DBpedia 的一组 1500 个实体序列化一些特定属性（大约十部电影的属性）。因此，对于每个实体，我运行一个 sparql 查询以检索它们，然后，对于每个 ResultSet，我使用默认的 apache jena tdb API 将所有数据存储在 tdb 数据集中。我为每个属性创建一个语句，并使用以下代码添加它们：

public void addSolution(QuerySolution currSolution, String subjectURI) {
    if(isWriteMode) {
        Resource currResource = datasetModel.createResource(subjectURI);

        Property prop = datasetModel.createProperty(currSolution.getResource("?prop").toString());
        Statement stat = datasetModel.createStatement(currResource, prop, currSolution.get("?value").toString());
        datasetModel.add(stat);
    }
}

我该怎么做才能在单个数据集上执行多个添加操作？我应该使用什么策略？

编辑：

我能够毫无错误地执行所有代码，但 TDBFactory 没有创建任何文件。为什么会发生这种情况？我认为我需要 Joshua Taylor 的帮助

score 2 · Accepted Answer

听起来查询正在远程 dbpedia 端点上运行。假设这是正确的，您可以做几件事。

首先将更新包装在事务中：

dataset.begin(ReadWrite.WRITE);
try {
  for (QuerySolution currSolution: results) {
    addSolution(...);
  }
  dataset.commit();
} finally {
  dataset.end();
}

其次，您可以通过使用CONSTRUCT来获取模型来节省自己的工作，而不必遍历结果。但是，我不清楚发生了什么subjectURI，但它可能很简单：

CONSTRUCT { <subjectURI> ?prop ?value }
WHERE
... existing query body ...

score 0 · Accepted Answer

我已经解决了我的问题，我想在这里提出我遇到的任何人都会遇到的问题。对于您执行的每个事务，您需要重新获取数据集模型，并且不要对所有事务使用相同的模型。

因此，对于您启动的每个事务，您需要在调用 begin() 之后获取数据集模型。我希望这会有所帮助。

java - 如何做多个添加操作apache jena tdb

2 回答 2

Related

Reference