0

朋友们,我们正在尝试解决一个问题,即我们只有评论转储,但 .csv 文件中没有评级。.csv 中的每一行都是客户对特定产品的评论,例如电视。

在这里,我想将该文本分类到该产品的领域专家给出的以下预定义类别中:

  • 质量
  • 顾客
  • 支持
  • 正面反馈
  • 价格
  • 技术

部分评论如下:

  1. 最近买了这个产品,感觉是市场上不错的产品。
  2. 一直在等待这个产品,但很失望
  3. 建造质量不是那么好
  4. LED 屏幕画面完美。喜欢这个产品
  5. 该死!2个月前买的这台电视,猜猜看,屏幕显示一条直线,LED屏幕质量差
  6. 这有非常复杂的选项,这台电视的文档不是那么用户友好
  7. 我无法使用我的智能设备连接到这台电视。根本行不通
  8. 客户支持非常差。我不推荐这个
  9. 效果很好。很棒的产品

现在,有 10 位不同客户的 10 条以上评论,我如何将它们分类到给定的桶中(您可以调用多标签分类或命名实体识别或带有情感分析的信息提取或任何东西)

我尝试了所有与 NLP 词频计数相关的东西(在 R 中)并参考了 StanfordNLP(https://nlp.stanford.edu/software/CRF-NER.shtml)等等。但无法得到具体的解决方案。

谁能指导我如何解决这个问题?谢谢 !!!

4

1 回答 1

0

大多数 NLP 框架将处理多类分类。R 中的字数本身可能不太准确。您可以探索的 Python 库是 Spacy。也可以使用 Google、AWS、Microsoft 等商业 API。每个类别都需要相当多的示例进行培训。随意发布您的代码以及您看到的问题或性能差距以获得进一步的帮助。

于 2018-02-10T22:31:18.767 回答