2

我是 xquery 的初学者,希望您能帮我简单解释一下。我正在使用 BaseX 7.0.1。

我有一个如下所示的 dictionary.xml 文件:

<doc>
    <entry>
        <vedette>je</vedette>
        <variante>je</variante>
        <variante>j'</variante>
        <partiedudiscours>pronom</partiedudiscours>
    </entry>
</doc>

我还有另一个 malone_fr.xml 文件,其中包含我要注释的文本,如下所示:

<doc>
    L’Opportunité 
    Par : Walter Malone (1866-1915)
    Ils ont mal conclu ceux qui disent que je ne reviendrai plus
    Quand une fois j’ai frappé à ta porte et ne t’ai pas rencontré,
</doc>

所以我想将dictionary.xml 的< variante > 部分的内容与我的文本进行比较,并用< partiedudiscous > 的内容标记文本。到目前为止,我已经能够使用以下代码做到这一点:

let $comp := data(for $j in tokenize(for $i in db:open('malone_fr')/doc return $i,"\n") 
return tokenize($j," "))
for $aa in $comp
return
for $lemme in db:open('dictionnaire')/doc/entry
return
let $oldName :=$aa
return
if ($oldName= $lemme/variante)
then 
let $newName := element  {$lemme/partiedudiscours}  {$aa}
return
for $bb in $comp
return
if ($bb=$oldName)
then $newName 
else ($bb)
else ()

这给了我以下结果:[第一次迭代]

L’Opportunité  Par : Walter Malone (1866-1915) Ils<verbe>ont</verbe> mal conclu ceux qui disent que je ne reviendrai plus

[第二次迭代]

L’Opportunité  Par : Walter Malone (1866-1915) <pronom>Ils</pronom>ont mal conclu ceux qui disent que je ne reviendrai plus

如您所见,它仅通过迭代显示每个单词的结果,而我需要一个带有整个文本注释的结果,如下所示:

L’Opportunité  Par : Walter Malone (1866-1915) <pronom>Ils</pronom><verbe>ont</verbe> <adverbe>mal</adverbe> <verb>conclu</verb> 

等等。我不知道如何处理 for 循环来做到这一点。

提前致谢。

4

1 回答 1

1

我认为您的解决方案比它需要的要复杂一些。您应该能够在一个循环中完成此操作。使用 XPath 执行查找 - 而不是显式循环遍历字典中的所有值 - 将允许您的数据库优化以更快地检索字典数据。

let $toks := data(
    for $i in db:open('malone_fr')/doc 
    return tokenize($i,"\s"))
for $t in $toks
return
    let $e := $dict/entry[variante = $t]    
    return
        if ($e)
        then (element { $e/partiedudiscours } { $t }, text{" "})
        else ($t, text{" "})

此外,该tokenize()步骤会丢弃空格,因此输出序列中不存在空格。它只会出现间隔,因为这通常是呈现一系列原子类型的默认方法;但是,正如您从测试输出中看到的那样,空间不会在元素周围呈现。在上面的解决方案中,我添加了非常基本的空间处理,因此元素的间距也正确。text{" "}如果不需要节点,您可以删除它们。

更新:添加了@DennisKnochenwefel 的建议

于 2012-09-26T15:56:07.627 回答