0

Hy,我正在从事基于产品评级情感分析的项目。 我有好词和否定词的数据集。当任何用户在网站上评论产品时,它会自动评分为 10 所以我对集群技术感到困惑,并且之前解决了我的问题Plzzx 帮助在此先感谢。

4

1 回答 1

1

您基本上是在问我们什么最适合您用作程序的分类器,而我们必须了解您的数据是如何存储的。

但是,您似乎只有两个课程,正面和负面。并且您想根据数据的单词分析对新数据进行分类。

我之前曾在此类问题上工作过,我使用 Rocchio 的 TF-IDF 算法进行此类分类。你给它一组训练数据(否定词和肯定词),它会对后来进入系统的内容进行分类。

它基于向量分类和余弦相似度距离度量。

欲了解更多信息,您可以阅读这篇论文您可以在此处找到该方法如何工作的示例(在非常小的数据上)。

注意:提供的示例是我参与的项目的一部分。

于 2017-02-06T05:03:56.137 回答