在测试了发现服务之后,至少对我来说似乎没用,或者我可能会遗漏一些东西。
当我查询时,它匹配文档并返回整个文档。如果我的文档很大,那么对于所有查询,它都会返回与查询文本匹配的整个文档,这是没有用的。
现在我必须为每个查询创建一个单独的文档吗?
如果是这种情况,API.AI或WIT.AI是更好的选择。
请清除我在这里缺少的东西!
在测试了发现服务之后,至少对我来说似乎没用,或者我可能会遗漏一些东西。
当我查询时,它匹配文档并返回整个文档。如果我的文档很大,那么对于所有查询,它都会返回与查询文本匹配的整个文档,这是没有用的。
现在我必须为每个查询创建一个单独的文档吗?
如果是这种情况,API.AI或WIT.AI是更好的选择。
请清除我在这里缺少的东西!
现在使用 Discovery,您需要将文档拆分一次以将它们放入集合中,然后在 Discovery 中针对集合的任何查询都将返回来自该组分离文档的结果。因此,如果您的文档没有更改,则此拆分应该是一次性操作。
尽管为查询自动识别较大文档的相关部分的解决方案是 Discovery 的一个很好的考虑因素(注意:我为 IBM Watson 工作)。
wit 或 api 更类似于我们的 watson 对话服务。发现是关于从语料库中查找相关内容,而您提到的两个以及我们的对话服务更多地是关于使用 NLP 通过对话来响应以理解查询。
现在有一个passages
可以传递给查询 API 的参数。在撰写本文时,它处于测试阶段。它提供文档中的位置以及“段落”文本和乐谱。
{
"document_id": "dd2a7574-c266-4587-812b-69a47aa271d6",
"passage_score": 23.961884787023948,
"passage_text": " query block name in many hints to specify the query block to which the hint applies. This syntax lets you specify in the outer query a hint that applies to an inline view.\n\nThe syntax of the query block",
"start_offset": 404,
"end_offset": 607
},
现在有一个文档分段选项可应用于您的发现配置。这允许 Discovery 在最初加载和索引文档时对文档进行分段。这是在 2017 年 10 月最后添加的。请注意,存在一些限制,特别是在保留自定义元数据方面。这是文档的链接。
https://console.bluemix.net/docs/services/discovery/building.html#doc-segmentation
Watson Discovery 服务允许在数百个文档中进行认知搜索。您可以使用 Watson Document Conversion 服务来为 JSON 格式的每个文档自动创建 PAU(可能的答案单元)粒度。然后,您可以在 Watson Discovery Service 中加载由 Watson Document Conversion 生成的 PAU。这样,Watson Discovery 将为您的认知查询返回准确的答案。