0

我必须为来自 DBpedia 的一组 1500 个实体序列化一些特定属性(大约十部电影的属性)。因此,对于每个实体,我运行一个 sparql 查询以检索它们,然后,对于每个 ResultSet,我使用默认的 apache jena tdb API 将所有数据存储在 tdb 数据集中。我为每个属性创建一个语句,并使用以下代码添加它们:

public void addSolution(QuerySolution currSolution, String subjectURI) {
    if(isWriteMode) {
        Resource currResource = datasetModel.createResource(subjectURI);

        Property prop = datasetModel.createProperty(currSolution.getResource("?prop").toString());
        Statement stat = datasetModel.createStatement(currResource, prop, currSolution.get("?value").toString());
        datasetModel.add(stat);
    }
}

我该怎么做才能在单个数据集上执行多个添加操作?我应该使用什么策略?

编辑:

我能够毫无错误地执行所有代码,但 TDBFactory 没有创建任何文件。为什么会发生这种情况?我认为我需要 Joshua Taylor 的帮助

4

2 回答 2

2

听起来查询正在远程 dbpedia 端点上运行。假设这是正确的,您可以做几件事。

首先将更新包装在事务中

dataset.begin(ReadWrite.WRITE);
try {
  for (QuerySolution currSolution: results) {
    addSolution(...);
  }
  dataset.commit();
} finally {
  dataset.end();
}

其次,您可以通过使用CONSTRUCT来获取模型来节省自己的工作,而不必遍历结果。但是,我不清楚发生了什么subjectURI,但它可能很简单:

CONSTRUCT { <subjectURI> ?prop ?value }
WHERE
... existing query body ...
于 2014-06-26T14:27:34.883 回答
0

我已经解决了我的问题,我想在这里提出我遇到的任何人都会遇到的问题。对于您执行的每个事务,您需要重新获取数据集模型,并且不要对所有事务使用相同的模型。

因此,对于您启动的每个事务,您需要在调用 begin() 之后获取数据集模型。我希望这会有所帮助。

于 2014-06-27T15:16:28.007 回答