5

我有大量的 yelp 数据,我必须将评论分为 8 个不同的类别。
类别

Cleanliness
Customer Service
Parking
Billing
Food Pricing
Food Quality
Waiting time
Unspecified


评论包含多个类别,所以我使用了 multilable 分类。但我很困惑如何处理正/负。示例评论可能对食品质量有利,但对客户服务不利。Ex-food taste was very good but staff behaviour was very bad. so review contains positive food quality but negative Customer service我该如何处理这种情况?我应该在分类之前进行情感分析吗?请帮我

4

3 回答 3

1

我认为您的数据与餐厅评论非常相似。它包含大约 100 条评论,每条评论中包含不同数量的方面术语(更多信息)。因此,您可以像这样使用基于方面的情感分析

1-Aspect term 提取

从评论中提取方面术语。

2 方面的极性检测

对于句子中给定的一组方面术语,确定每个方面术语的极性是正的还是负的。

3-识别方面类别

给定一组预定义的方面类别(例如,食品质量、客户服务),识别给定句子中讨论的方面类别。

4-确定极性

给定一组预先确定的方面类别(例如,食品质量、客户服务),确定每个方面类别的极性(正面、负面)。

有关类似项目的更多信息,请参阅此内容。

我希望这可以帮助你。

于 2017-08-02T20:22:00.710 回答
0

是的,您需要进行情绪分析。为什么不创建数据标记,即从句子中找到所需的单词,现在最可能的方法是找到相关单词及其情绪。即食物很好,但清洁度不合适

在这种情况下,您现在有 [ food, good, cleanliness, not, proper ] food 与其下一个术语和 cleanliness 与其下一个术语“不合适”相关联

再次,您可以将其分为两类,即 1,0 代表好与坏 .. 或者您可以根据您的情况添加类。然后你会有这样的数据:

--------------------
FEATURE     |  VAL
--------------------
Cleanliness    0
Customer      -1
Service       -1
Parking       -1
Billing       -1
Food Pricing  -1
Food Quality   1
Waiting time  -1
Unspecified   -1

我已经举了一个例子,其中 -1,1,0 分别代表没有审查,好和坏。您可以将更多类别添加为 0,1,2 bad fair good 我可能不太擅长回答这个问题,但这就是我的感受。

注意:您需要了解您的模型不可能完美,因为这就是机器学习的全部内容,您一定是错的。你的模型不能给出一个完美的分类,它必须是错误的某些输入,它会随着时间的推移学习和改进。

于 2017-08-02T11:49:51.587 回答
-1

有很多方法可以进行多标签分类。

最简单的方法是为每个类建立一个模型,如果评论达到该标签的某个阈值分数,您可以将该标签应用于评论。

这将独立处理这些类,但这似乎是解决您问题的好方法。

于 2017-08-01T23:25:09.323 回答