1

我有一个包含 TEI XML 文档的 MarkLogic 数据库。我构建了一个应用程序来搜索和显示这些文档。在测试过程中,我们发现在搜索时没有找到某些关键字,并缩小问题范围,发现没有找到的关键字在以下元素中:

<foreign xml:lang="lat">unio cum ipso</foreign>

搜索拉丁短语“unio cum ipso”返回零结果。我认为这与@xml:lang 有关,但我想知道是否有人遇到过类似的问题以及他们是如何解决的。谢谢!

4

2 回答 2

3

如果您正在进行词干搜索(默认),它将是语言敏感的,除非另有说明,否则将使用数据库中的默认语言。如果要进行跨语言搜索,请使用该unstemmed选项。

于 2019-02-21T16:50:31.173 回答
0

感谢@mholstege 和@Wagner Michael,我能够解决这个问题。问题是我们使用@xml:lang 来指定多种语言,而没有针对默认英语以外的任何内容的MarkLogic 许可证密钥。如果您没有适当的许可证密钥,Marklogic 会将任何 @xml:lang 值视为通用语言,因此在数据库中搜索这些非英语术语的任何关键字都不会返回任何匹配项。

请参阅Marklogic 的搜索开发人员指南,第 2 章。28以获得比我能给出的更好的解释。:)

于 2019-02-22T20:03:28.197 回答