我想使用 Solr 作为已发布 Tridion 内容的客户端搜索引擎。它可能会作为与主应用程序断开连接的 RESTful 服务来完成。
由于我们几乎肯定会使用样板 DD4T,所有内容都发布到 Broker,因此我有一些担忧,尤其是在索引 PDF 或 Word 文件等二进制文件时——听起来数据库可能会有很大的压力?
推荐什么策略来检索二进制文件并以这种方式索引它们?听起来这会比我们在数据库外部拥有二进制项目更困难?
我们已经决定将二进制文件发布到文件系统 - 您只需在 cd_storage_conf.xml 中配置它,如下所示:
<Publication Id="9" defaultStorageId="defaultdb" cached="true">
<Item typeMapping="Binary" storageId="defaultFile" cached="true"/>
</Publication>
但是,即使您确实选择将二进制文件发布到数据库,这也不应该影响您的 Solr 索引,该索引将完全独立于代理数据库。您将需要编写一些自定义(自定义部署程序?)将您的数据推送到 Solr 索引中,并且您可以选择忽略二进制文件。