1

我正在寻找一些关于如何解决我的问题的指示。我在 ML8.0 中创建了一个内容存储库,其中存储了文件。当文件上传到数据库时,我有自定义 cpf 来创建工件文件(一个提取的文本,另一个 xml 文件,它是输入文件的注释和一个主文件(XML),它引用了上传的原始文件和提取和注释文件)。
主文件还包含其他信息,例如<type/><source/>标签。我能够创建一个自定义搜索端点,当搜索将只返回主文档时,即使搜索命中在工件文档中也是如此。
我的困境是,我想为<source/>标签添加分面<type/>标签.. 并且还想为带注释的文档中的某些标签添加分面。因此,如果搜索同时命中主文档和一个或多个工件文档,则分面应视为源标签中只有 1 个命中和源标签内的相应类型。
我希望我没有混淆,我正在寻找一些指针。也许这张图可能有助于理解我的问题.. 这是一个示例,但我有 1000 份文件 在此处输入图像描述

4

2 回答 2

4

我不清楚具体细节,但总的来说,分面从索引中起作用,这对于大规模性能是必要的。

您应该具体化您希望索引在作为搜索目标的文档中直接反映的内容,而不是尝试动态解析方面的引用。

也就是说,作为工作流程的一部分,生成您想要查找和分面的文档。您还可以考虑为工作流文档创建不同的数据库或使用不同的词汇表,这样您就不需要自定义搜索端点来隐藏它们。

希望有帮助,

于 2016-03-11T01:48:14.733 回答
1

听起来你想要一个 facet on <source>,然后为每个源 facet 值向下钻取<type>该源值。您可以使用两个相邻的普通构面,一旦您从源中选择特定值,类型构面将显示向下钻取部分。

您也可以尝试在源和类型的组合上利用元组,但这需要在服务器端和客户端进行一些手动工作。

于 2016-03-11T05:52:12.887 回答