1

我有一个xquery这样的单词序列(和,交易,搜索,业务)。现在我想在文档(如 pdf、doc、ppt)以及xml文件中搜索此序列。如果任何单词在任何文档中匹配,URI则应返回该文档的。什么是最有效的Marklogic方法xquery

4

1 回答 1

0

听起来第一个问题是从用户提供的字符串中标记单词。这是使用cts:tokenize http://docs.marklogic.com/5.0doc/docapp.xqy#display.xqy?fname=http://pubs/5.0doc/apidoc/SearchBuiltins.xml&category=SearchBuiltins&function=cts 的简单方法:标记化

cts:tokenize('now is the time')[. instance of cts:word]

一旦有了单词,就可以将它们与cts:word-query构造函数和一起使用cts:search,或者您可以扩展高级搜索 API 来处理这个问题:也许使用search:resolve http://docs.marklogic.com/5.0doc/docapp.xqy#display。 xqy?fname=http://pubs/5.0doc/apidoc/searchapi.xml&category=Search&function=search:resolve

自然,任何二进制内容(pdf、doc、ppt)都需要先进行文档转换:http://docs.marklogic.com/5.0doc/docapp.xqy#display.xqy?fname=http: //pubs/5.0doc/xml /search-dev-guide/binary-document-metadata.xml

于 2012-09-06T18:30:06.950 回答