我希望用一些以前没有使用过的新数据源来训练一个朴素的贝叶斯。我已经查看了 IMDB 评论的 Lee & Pang 语料库和 MPQA 意见语料库。我正在寻找符合以下标准的新 Web 服务。
- 易于分类 - 必须有喜欢/不喜欢或 5 星评级
- 一应俱全
- 与新材料有关(不如前两个重要)
以下是我自己提出的一些示例。
- Etsy API
- 烂番茄 API
- Yelp API
任何其他建议将不胜感激 =)
我希望用一些以前没有使用过的新数据源来训练一个朴素的贝叶斯。我已经查看了 IMDB 评论的 Lee & Pang 语料库和 MPQA 意见语料库。我正在寻找符合以下标准的新 Web 服务。
以下是我自己提出的一些示例。
任何其他建议将不胜感激 =)
在 Pang&Lee 的后期作品(2008 年)“意见挖掘和情绪分析”中,他们有一个公开可用资源的部分。它与这些语料库有链接。
看看sentiment140。它有一个语料库,您可以下载和训练。您可以轻松扩展到新推文。