0

我对检索和排名以及文档转换服务仍然很陌生,所以我最近一直在玩这个。

我遇到了一个问题,当我上传大型文档(100 多页)时,检索和排名会帮助我自动将其分解为答案单元,这非常有用。

但是,有些问题只需要大块答案单元中的一条小线,有没有一种方法可以手动进一步分解检索和排名服务提供给我的答案单元?

我听说你可以通过 JavaScript 做到这一点,但有没有办法通过 UI 做到这一点?

我正在考虑手动将庞大的文档分解为多个较小的文档,但这可能会导致 100 多个文档——这可能是我最后的选择。

非常感谢任何帮助或建议!

谢谢你们!

4

1 回答 1

3

首先,澄清一点:

Retrieve and Rank 不会将您的文档分解为答案单元。当您的转换目标是ANSWER_UNITS.

关于你的问题:

我不完全理解您要做什么,但是如果默认生成的答案单元不符合您的要求,您可以自定义转换过程的不同步骤来调整生成的答案单元。看看这里的文档。

具体来说,您要确保标题级别(对于 Word、PDF 或 HTML,取决于您的文档类型)以检测每个答案单元的开头的方式定义。然后,确保您定义的标题级别(h1、h2、h3 等)包含在selector_tags该部分的列表中answer_units

一旦您的自定义文档转换服务配置生成了您正在寻找的答案单元,您就可以将它们发送到 Retrieve 和 Rank 以进行索引。

于 2017-02-22T16:55:14.753 回答