0

我想训练我的 Discovery 集合,我已经上传了 200 多个文档。我通过 GUI 上传了这些文档。查看 Discovery 文档,我知道我必须调用 API 来训练我的集合,因为训练 API 尚未通过 GUI 公开。作为培训 API 调用的一部分,我需要包含一个如下所示的文档:

{
  "natural_language_query": "{natural_language_query}",
  "filter": "{filter_definition}"
  "examples": [
    {
      "document_id": "{document_id_1}",
      "cross_reference": "{cross_reference_1}",
      "relevance": 0
    },
    {
      "document_id": "{document_id_2}",
      "cross_reference": "{cross_reference_2}",
      "relevance": 0
    }
  ]
}

我的问题是我应该如何获取我已经上传的文档的 documentIds?有没有办法通过 GUI 找到它?或者可能是一个 API 调用,它会返回如下内容:

{
  "document_name" = "MyDocument1",
  "documentId" = "the_document_id_for_MyDocument1"
},

...

{
  "document_name" = "MyDocumentN",
  "documentId" = "the_document_id_for_MyDocumentN"
}

或者获取documentIds的唯一方法是创建一个新集合并直接通过API调用上传所有文档并在我取回documentIds时跟踪它们?

4

1 回答 1

0

使用 GUI,执行以下步骤:

  1. 在“分组查询结果(聚合)”文本框中输入term(_id)
  2. 在“返回的字段”下,选择“指定”进行输入 extracted_metadata

请注意,查询和过滤输入应保持为空

于 2017-06-09T01:47:49.040 回答