-1

我想构建一个应用程序,我可以在其中输入任何 Twitter 关键字,后端将抓取相关的推文并返回推文的情绪分析,以负面、中性和正面推文的百分比表示。例如,我输入关键字“百事可乐”,应用程序将输出如下内容:与百事可乐相关的推文包含 10% 的负面情绪、10% 的中性情绪和 80% 的正面评论。

所以问题是如何训练机器学习算法,我可以在后端使用它来对各种主题进行情感分析。这里涉及的主要思想是迁移学习,我们在大量标记数据上训练一个模型,并将其用作训练其他数据的基线。迁移学习在 NLP 中存在局限性,主要是因为在一项任务中学到的知识不够广泛,无法向下传递到其他任务。例如,我预训练了一个很好的神经网络来对航空公司进行情绪分析,预测准确率超过 70%。然而,当我使用相同的模型对百事可乐进行情感分析时,我得到的预测准确率只有 30% 左右。

我做了一些研究,发现谷歌的通用句子嵌入非常流行。但是,我意识到这是一种将输入文本转换为特征向量的新方法,而不是通用算法。我想知道任何人都可以指出我应该去的方向吗?提前非常感谢!

4

1 回答 1

0

fast.ai这篇论文声称他们已经成功地将迁移学习用于文本分类任务。你应该看看。

于 2019-02-02T02:33:17.337 回答