prediction - 情绪分析 Google Prediction API

Question

我正在阅读有关 Google Prediction API 的信息，但无法弄清楚文档的一部分。

从用例来看，我在这部分有点卡住了：

每行只能分配一个标签，但您可以通过重复一个示例并为每个示例应用不同的标签来为一个示例应用多个标签。例如：“兴奋”、“天哪！刚刚度过了美好的一天！” “烦人”、“天哪！刚刚度过了美好的一天！” 如果你向这个模型发送一条推文，你可能会得到一个类似这样的分类：“兴奋”：0.6，“烦人”：0.2。

为什么它会放 "excited":0.6, "annoying":0.2 而没有更多的功能。为什么首选兴奋？

score 2 · Accepted Answer

不是“兴奋”标签是首选，而是消息实际上应该被归类为“兴奋”而不是“恼火”的概率。

假设我有 2 个情绪分类：“看涨”和“看跌”。然后，我在 Prediction API 中使用偶数的“看涨”和“看跌”训练数据训练模型。当我向 Prediction API 提交消息以获取情绪时，它会读取文本并根据消息中的单词分配“看涨”和“看跌”概率。概率之和将加起来为 1。

再说一遍，并不是一个标签比另一个标签更受欢迎，而是消息“兴奋”的概率是“恼火”的 3 倍。

score 1 · Accepted Answer

如果你只用这两个例子训练模型，句子“OMG！刚刚度过了美好的一天！”的“兴奋”和“烦人”标签，查询分类时唯一合理的结果是这样的推文“OMG！刚刚有一个美妙的一天！” 应该是“兴奋”：0.5，“烦人”：0.5。

所以谷歌文档中可能没有完美地解释这种情况。我想他们更专注于解释可以将 2 个不同的标签与完全相同的句子相关联。

2 回答 2