0

我试图找出从大量文档中单独提取关键字和概念的正确方法。在 DW 上,建议使用 IBM Watson-Knowledge Studio。Knowledge Studio 链接到 Discovery,我似乎无法在 Discovery API 参考中找到如何单独提取关键字和概念。我可以轻松地查看宏观层面的概念,但是我需要单独为每个文件提供关键字和概念。我的所有文件都已上传到 Knowledge Studio。此外,我还将所有内容都上传到了 Discovery。我无法提取每个文件的信息。API 参考指南不包括将信息提取到已上传文件的单个级别。上个星期,我提交了一张支持票,回复是在 Stackoverflow 上发布问题以获得额外支持。在大量文件中单独查找每个文件的关键字和概念的正确方法是什么?发现还是 NLU?

非常感谢任何指导。

4

1 回答 1

1

我认为您应该尝试自然语言理解服务。这是一个演示,可让您分析文本并提取概念和关键字https://natural-language-understanding-demo.mybluemix.net/

我建议您先阅读文档,然后查看API 参考,您将在其中了解如何调用该方法以提取基于不同语言的关键字和概念。

您需要做的是遍历文件,读取内容,然后将其发送到 NLU。

以下是如何分析文本以提取 Node.js 中的概念和关键字的示例:

const NaturalLanguageUnderstandingV1 = require('watson-developer-cloud/natural-language-understanding/v1.js');
const service = new NaturalLanguageUnderstandingV1({
  'username': '{username}',
  'password': '{password}',
  'version_date': '2017-02-27'
});

const parameters = {
  text: 'IBM is an American multinational technology company headquartered in Armonk, New York, United States, with operations in over 170 countries.',
  features: {
    keywords: {
      emotion: true,
      sentiment: true,
      limit: 2
    },
    concepts: {
      limit: 3
    }
  }
}

service.analyze(parameters, (err, response) => {
  if (err)
    console.log('error:', err);
  else
    console.log(JSON.stringify(response, null, 2));
});
于 2017-10-16T14:49:25.017 回答