8

我正在编译一个推文语料库以进行情绪分析,并试图用 Apple Emoji 字符抓取推文。

我发现其中一张脸的 unicode 字符为:U+1F604 (U+D83D U+DE04), UTF-8: F0 9F 98 84

到目前为止,我还没有得到任何有意义的结果。如果我搜索\ud83d\ude04我会得到一些推文,但没有任何用处。 \U0001f604搜索时不返回任何内容。

我有什么办法可以在 Twitter 上查询这些字符吗?

我正在为 API 使用 python-twitter 包装器,但如果存在更好的替代方案,我愿意使用其他东西。

4

2 回答 2

5

正如@Terence Eden 指出的那样,twitters REST 搜索 api 不适用于表情符号字符,但流 API 可以(截至 2016 年 1 月)。

有一些工具可以在 python 中访问 twitters API。我用得最多的那个tweepy。它可以安装pip

关于设置流 api的tweepy 文档很容易理解。您过滤的字符串需要包含实际的表情符号字符(例如:'')。

请注意,这会将表情符号搜索为“单词”:即被空白包围。找不到像“免费”这样的东西!

于 2016-01-29T12:04:41.483 回答
3

这是可能的 - 但它有点棘手......

您不能使用标准的 Twitter 搜索 - 但可以使用流式搜索。

Ruby 和 Node中的https://github.com/mroth/emojitrack-feeder提供了开源库。

于 2014-05-26T13:08:36.830 回答