我认为您应该尝试自然语言理解服务。这是一个演示,可让您分析文本并提取概念和关键字https://natural-language-understanding-demo.mybluemix.net/。
我建议您先阅读文档,然后查看API 参考,您将在其中了解如何调用该方法以提取基于不同语言的关键字和概念。
您需要做的是遍历文件,读取内容,然后将其发送到 NLU。
以下是如何分析文本以提取 Node.js 中的概念和关键字的示例:
const NaturalLanguageUnderstandingV1 = require('watson-developer-cloud/natural-language-understanding/v1.js');
const service = new NaturalLanguageUnderstandingV1({
'username': '{username}',
'password': '{password}',
'version_date': '2017-02-27'
});
const parameters = {
text: 'IBM is an American multinational technology company headquartered in Armonk, New York, United States, with operations in over 170 countries.',
features: {
keywords: {
emotion: true,
sentiment: true,
limit: 2
},
concepts: {
limit: 3
}
}
}
service.analyze(parameters, (err, response) => {
if (err)
console.log('error:', err);
else
console.log(JSON.stringify(response, null, 2));
});