显然,以下模块仅索引 Orchard 站点中的内容:
http://docs.orchardproject.net/Documentation/Search-and-indexing
如果我上传 DOC、XLS、PPT 或 PDF 文件,其内容不会被添加到索引中。
是否有一种开箱即用的方式来包含这些内容,还是我必须扩展索引机制?
如果后者是真的,那么欢迎任何关于如何做到这一点的提示。谢谢!
编辑:通过“上传文件”,我的意思是标准媒体上传到/Media
文件夹。
显然,以下模块仅索引 Orchard 站点中的内容:
http://docs.orchardproject.net/Documentation/Search-and-indexing
如果我上传 DOC、XLS、PPT 或 PDF 文件,其内容不会被添加到索引中。
是否有一种开箱即用的方式来包含这些内容,还是我必须扩展索引机制?
如果后者是真的,那么欢迎任何关于如何做到这一点的提示。谢谢!
编辑:通过“上传文件”,我的意思是标准媒体上传到/Media
文件夹。
它不是开箱即用的,但可以自己实现,尤其是即将推出的 Orchard 1.7,它将使上传的媒体文件成为内容项。
有一些扩展点,OnIndexing<T>
内容处理程序方法是最简单和最直接使用的。这是提取关键字并将它们添加到索引的地方。查看现有实现以获取示例。
说到关键字提取 - 我使用iTextSharp处理 PDF 和MS OpenXML SDK 2.0处理 Office 文档(尽管它只适用于新格式 - DOCX、PPTX 和 XLSX)。对于遗留的非 XML Office 格式,您需要一些其他库 - 网络上有很多这样的库。