0

我有 100 个 pdf 文件。我使用 Watson 文档转换服务将 pdf 文档转换为 JSON 应答单元。现在我需要训练这些文件。

我编写了需要 JSON 答案单元和文档相关性分数作为 Watson R 和 R 的输入的 python 代码。如何通过 python 代码引用 JSON 答案单元或如何通过 Python API 从文档转换服务下载 JSON 答案单元

4

1 回答 1

0

我想你可以从 IBM Developers (Node SDK)看到这个例子。这一显示了一个参考 JSON 答案单元的示例。

编程语言是其他语言,但您可以使用相同的逻辑来做您想做的事情,文档转换集成示例展示了如何使用文档转换服务将文档转换为答案单元并将其上传到检索和排名服务以使答案单元可搜索。

  1. 创建 solr 集群,上传 solr 配置并创建集合

    1.1 在文件retrieve_and_ran_lifecycle.v1.js 和retrieve_and_rank_solr.v1.js 中,您将找到有关如何执行这些步骤的示例函数。

    1.2 重要提示:上传 solr 配置时,请使用资源文件夹中的 [answer_unit_config.zip],其中包含定义将被索引的字段的 schema.xml。

  2. 编辑文件 document_conversion_integration.v1.js 并输入以下内容:

    2.1 Document Conversion 和 Retrieve and Rank 服务的服务凭证(每个服务实例有一组不同的凭证)

    2.2 clusterId(创建集群时获取)

    2.3 如果您使用与默认值不同的值,则 collectionName 和 inputDocument

  3. 运行以下命令:
node document_conversion_integration.v1.js
于 2017-06-20T12:35:51.893 回答