1

我们正在编写一个演示应用程序,其中我们使用了 Google 的云语音 API 和自然语言 API。我们将它用于电视机和机顶盒中的语音控制。

总的来说,我必须说 API 运行良好。

但是,我们想知道是否可以自定义自然语言 API 以在我们的行业中更具体。

更具体地说,我们在传递给特定实体的显着性分数方面遇到了问题。

例如,将以下文本数据传递给 Google Cloud API: “给我看像 Zoolander 这样的电影。”

给我们以下结果:

实体名称 | 实体类型 | 元数据 | 显着性

电影 | WORK_OF_ART | {} | 0.7970062 Zoolander | WORK_OF_ART | {'mid': '/m/01shy7', 'wikipedia_url': ' https://en.wikipedia.org/wiki/Zoolander '} | 0.20299383

实体 Zoolander 的显着性非常低,尽管它是句子中最重要的实体......

有什么办法可以改善吗?或者是否有任何其他可以定制的自然语言 API?

4

2 回答 2

0

由于 Google 使用自己的数据来训练机器学习模型,因此无法改进 API 结果,并且没有自定义选项。

拥有自定义模型的唯一方法是自己训练它,例如使用AutoML。但这需要很多努力。

您可以提交功能请求以根据上下文“调节”结果(或者我可以为您完成),这可能会以某种方式影响显着性分数,而不是仅考虑文本上的单词相关性。

无论如何,这可能没有必要,因为我看到第一个结果和第二个结果之间存在重要的显着差异。您是否尝试过使用salience scores差异而不是salience absolute value?还是特定“类型”结果的分数乘数(WORK_OF_ART在这种情况下)?

我知道这个解决方案可能适用于某些句子,但不适用于其他句子。

于 2018-07-07T15:44:19.927 回答
0

我正在评估 Google Cloud Natural Language,但找不到任何可以自定义上下文的内容……所以这似乎是不可能的 :(

于 2018-07-02T13:18:14.973 回答