1

我正在使用xdmp:document-filter(doc())从文档(doc、docx、pdf 等)中提取元数据。我们使用它是因为它适用于所有类型的文档格式并为每种类型的文档生成XHTML格式。但是这个命令的主要缺点是它会减慢查询速度。如果数据库中有一个或两个文档,则查询工作正常,但如果有更多文档(例如 10 或 15 个),则查询速度会变慢。我们想从数据库中所有文档的元数据中提取和显示信息。

我们正在使用这个查询:-

for $d in fn:doc()
return xdmp:document-filter(doc(fn:base-uri($d)))

有什么方法可以让这个查询更快地工作,或者有什么替代方法xdmp:document-filter()吗?

4

1 回答 1

2

通常xdmp:document-filter()在 ETL 时使用。如果您使用 Information Studio 加载内容,则可以添加“过滤文档”转换。您可以选择将提取的元数据存储为单独的 xhtml 文档或文档属性。这样他们就不需要在每次请求时动态计算。

于 2012-08-07T14:43:19.980 回答