1

我希望用一些以前没有使用过的新数据源来训练一个朴素的贝叶斯。我已经查看了 IMDB 评论的 Lee & Pang 语料库和 MPQA 意见语料库。我正在寻找符合以下标准的新 Web 服务。

  1. 易于分类 - 必须有喜欢/不喜欢或 5 星评级
  2. 一应俱全
  3. 与新材料有关(不如前两个重要)

以下是我自己提出的一些示例。

  • Etsy API
  • 烂番茄 API
  • Yelp API

任何其他建议将不胜感激 =)

4

2 回答 2

1

在 Pang&Lee 的后期作品(2008 年)“意见挖掘和情绪分析”中他们有一个公开可用资源的部分。它与这些语料库有链接。

于 2012-02-15T15:11:51.193 回答
1

看看sentiment140。它有一个语料库,您可以下载和训练。您可以轻松扩展到新推文。

于 2013-03-15T22:53:54.410 回答