1

我是一名学生,我想找到一个大数据搜索引擎。我找到了 MarkLogic Server,但我不知道它支持哪些文件类型。是否支持doc、docx、pdf、xml、ppt、pptx等?还支持哪些其他类型?

4

1 回答 1

3

在底层,MarkLogic 支持 xml、纯文本和二进制的存储。XML 是完全可搜索的,包括用于分面搜索的范围索引。文本只能全文搜索。二进制不能按原样搜索,但有一些工具可以从许多二进制格式中提取元信息和文本。您可以在在线文档中找到有关后者的更多详细信息:

http://docs.marklogic.com/guide/search-dev/binary-document-metadata#chapter

有一个示例应用程序显示了此功能:

http://developer.marklogic.com/code/document-discovery

于 2013-07-15T08:16:42.993 回答