-3

我从 API 接收 json 数据:

json = {"lat": null, "body_text": "@edinburgh \u2764\ufe0f", "deduplicated_time": "2020-11-05T15:38:11.744710"}

我使用 Python 加载 json 消息。

msg_body = json.loads(msg.body,strict=False)

我使用 VaderSentiment 从 json 消息的 body_text 部分的文本中提取情绪。

问题是当红色的心❤表情符号作为 \u2764\ufe0f 包含在文本 Vader 中时,无法预测正确的情绪。在他们的页面上,他们建议 vader 正在翻译 utf-8 编码的表情符号,例如 and 和 。我相信 \u2764\ufe0f 不是 UTF-8 ,如何使用 python 将它变成 UTF-8 ?

如果以下页面表情符号正确,则 \u2764\ufe0f 是“python src”编码。

4

1 回答 1

2

这是一个 JSON 编码的 Unicode 字符。解码JSON,例如用json.loads,你会得到一个带有红心的Python 字符串。如果您需要将其编码为 UTF-8 编码bytes,请使用str.encode(尽管您想要使用它的库可能需要普通的 Python strs)。

于 2020-11-05T21:13:46.030 回答