2

为了解决这个问题,我希望你给我一些建议。在大学里,我一直在解决意见挖掘任务,但在 Twitter 上,方法完全不同。例如,我使用集成学习方法对用户对西班牙某家酒店的看法进行分类。当然,我得到了一个包含正面和负面意见的训练集,然后我用测试集进行了测试。但是现在,有了推特,我发现这种分类非常困难。

  1. 我需要训练集吗?如果这个问题的答案是肯定的,你不觉得 twitter 这么短暂,所以如果我有那个设置,我在未来主题上的表现会很差吗?

  2. 我正在考虑获取一本字典(主要是形容词)并将我的推文与它交叉并获得一个术语文档矩阵,但我没有为任何推特分配类。此外,积极形容词和消极形容词可能会因主题和时间而异。那么,如何处理呢?

  3. 如何处理语言问题?例如,我想研究用英语和西班牙语写的推文,但要分开研究。

  4. 你建议用哪种编程语言来做这样的事情?我一直在尝试使用 R 包,例如 tm、twitteR。

4

3 回答 3

1
  1. 当然,我认为情绪的使用方式会在几个月内保持不变。最坏的情况是你重新贴标签并重新训练。根据我的经验,无监督学习在工业应用方面有着糟糕的记录。
  2. 你需要一些情感/ adj 字典来处理情感——那里有一些数据集,但我忘记了它们在哪里。我可能已经用更好的信息回答了以前的问题。
  3. 只做英文推文,构建语言分类器相当容易,但你想从小处着手,所以放轻松
  4. Python (NLTK) 如果您想用少量代码轻松完成。Java 有很好的 NLP 东西,但 Python 和它的库对用户更友好
于 2012-05-02T21:03:32.450 回答
1

该站点:https ://sites.google.com/site/miningtwitter/questions/sentiment提供了 3 种使用 R 进行情绪分析的方法。

twitter 包现已更新,可与新的 twitter API 一起使用。我希望你下载包的源版本以避免重复推文。

我正在编写一本用于意见挖掘的西班牙语词典,并将在可访问的地方发布。

干杯!

于 2013-05-04T20:09:15.957 回答
0

如上所述,情绪分析只会给出 3 个结果 - 正面、负面和中性。我找到了一个关于 Twitter 情绪分析的教程,很简单。

我在这里找到了 - https://www.ai-ml.tech/twitter-sentiment-analysis/

我只下载了 3 个依赖项,并且完成了较少的代码。只要通过它,你就会得到解决方案。

于 2018-11-20T07:48:04.940 回答