xml - 在 Marklogic 数据库中存储名称/值对的最有效方法是什么

Question

我的应用程序经常需要在它所服务的文档中装饰值，使用查找获取各种代码的人类可读形式。

例如<product_code>PC001</product_code>希望返回为<product_code code='PC001'>Widgets</product_code>. 并不总是product_code；有几种不同类型的代码需要类似的行为（其中一些只有几十个示例，其中一些有几千个。）

我想知道将这些数据存储在数据库中的最有效方法是什么？我能想到两种可能：

1) 每种代码类型一个文档，包含许多元素：

<product-codes>
  <product-code code = "PC001">Widgets</product-code>
  <product-code code = "PC002">Wodgets</product-code>
  <product-code code = "PC003">Wudgets</product-code>
</product-codes>

2) 每个代码一个文档，每个包含一个<product-code>元素，如上。

（显然，这两个选项都将包括合理的索引）

其中任何一个明显比另一个快吗？还有其他更好的选择吗？

我的感觉是，通常最好为每个文档保留一个“东西”，因为它在概念上稍微干净一些并且（我理解）更适合 ML 的索引，但在这种情况下，这似乎会导致大量非常小的文件. 这是我应该担心的事情吗？

score 8 · Accepted Answer

任何需要独立搜索的东西都应该是它自己的文档或片段。但是，如果您只是进行查找，那么元素属性范围索引在返回值时应该非常快：

element-attribute-range-query(xs:QName('product-code'), xs:QName('code'), '=', 'PC001') 
=> 
Widgets

使用范围索引，无论您如何分块文档，查找都将从同一个索引发生。因此，除非您需要使用 cts:search onproduct-code来检索实际元素，否则您如何分块文档并不重要。

score 7 · Accepted Answer

另一种方法是存储一个表示名称-值对的映射。

let $m := map:map()
let $_ := map:put($m, 'a', 'fubar')
return document { $m }

这将返回哈希图的 XML 表示形式，可以使用xdmp:document-insert. map:map您可以使用构造函数将 XML 映射转换回本机映射。原生地图也可以使用xdmp:set-server-field.

xml - 在 Marklogic 数据库中存储名称/值对的最有效方法是什么

2 回答 2

Related

Reference