我是一名学生,我想找到一个大数据搜索引擎。我找到了 MarkLogic Server,但我不知道它支持哪些文件类型。是否支持doc、docx、pdf、xml、ppt、pptx等?还支持哪些其他类型?
问问题
152 次
1 回答
3
在底层,MarkLogic 支持 xml、纯文本和二进制的存储。XML 是完全可搜索的,包括用于分面搜索的范围索引。文本只能全文搜索。二进制不能按原样搜索,但有一些工具可以从许多二进制格式中提取元信息和文本。您可以在在线文档中找到有关后者的更多详细信息:
http://docs.marklogic.com/guide/search-dev/binary-document-metadata#chapter
有一个示例应用程序显示了此功能:
http://developer.marklogic.com/code/document-discovery
!
于 2013-07-15T08:16:42.993 回答