我收到了数以万计的用户对该应用程序的评论。
我知道很多评论的意思都是一样的。
我无法阅读所有这些评论。因此,我想用一个python程序来分析所有的评论,找出最频繁最重要的反馈信息。
我想问一下,我该怎么做?
我可以下载一个应用所有的评论,也初步了解了Google Prediction API。
我收到了数以万计的用户对该应用程序的评论。
我知道很多评论的意思都是一样的。
我无法阅读所有这些评论。因此,我想用一个python程序来分析所有的评论,找出最频繁最重要的反馈信息。
我想问一下,我该怎么做?
我可以下载一个应用所有的评论,也初步了解了Google Prediction API。
您可以使用 Google Prediction API 将您的评论定性为重要或不重要。您想要做的是手动分类您的评论子集。然后,您将手动分类的模型上传到 Google Cloud Storage,并使用 Prediction API 训练您的模型。此步骤是异步的,可能需要一些时间。训练好的模型准备就绪后,您可以使用它以编程方式对剩余(以及任何未来)评论进行分类。
请注意,您手动分类的评论越多(即您的训练集越大),您的程序化分类就越准确。此外,您可以将这个想法扩展如下:代替二元分类(重要/不重要),您可以使用重要性等级,例如 1-5 级。当然,这需要更多的体力劳动来构建模型,因此最佳策略将取决于您的需求以及您可以花费多少时间来构建模型。