我从 API 接收 json 数据:
json = {"lat": null, "body_text": "@edinburgh \u2764\ufe0f", "deduplicated_time": "2020-11-05T15:38:11.744710"}
我使用 Python 加载 json 消息。
msg_body = json.loads(msg.body,strict=False)
我使用 VaderSentiment 从 json 消息的 body_text 部分的文本中提取情绪。
问题是当红色的心❤表情符号作为 \u2764\ufe0f 包含在文本 Vader 中时,无法预测正确的情绪。在他们的页面上,他们建议 vader 正在翻译 utf-8 编码的表情符号,例如 and 和 。我相信 \u2764\ufe0f 不是 UTF-8 ,如何使用 python 将它变成 UTF-8 ?
如果以下页面表情符号正确,则 \u2764\ufe0f 是“python src”编码。