0

我正在 Twitter 上搜索来自索马里的推文。这就是我得到的:

T\u00fcrk K\u0131z\u0131lay\u0131 Genel Ba\u015fkan\u0131m\u0131z Sn. @AhmetLutfiAkar yar\u0131n sabah 08:00'e TV8'de canl\u0131 yay\u0131n konu\u011fu olacak... @TurkKizilayi

我追踪了原始推文,实际上是这样写的:

Türk Kızılayı Genel Başkanımız Sn. @AhmetLutfiAkar yarın sabah 08:00'e TV8'de canlı yayın konuğu olacak... @TurkKizilayi

如何自动将我得到的版本转换为正确的编码?

谢谢!

4

2 回答 2

2

你所拥有的看起来非常像unicode: (注意u双引号之前的。)

In [41]: print(u"T\u00fcrk K\u0131z\u0131lay\u0131 Genel Ba\u015fkan\u0131m\u0131z Sn. @AhmetLutfiAkar yar\u0131n sabah 08:00'e TV8'de canl\u0131 yay\u0131n konu\u011fu olacak... @TurkKizilayi")
Türk Kızılayı Genel Başkanımız Sn. @AhmetLutfiAkar yarın sabah 08:00'e TV8'de canlı yayın konuğu olacak... @TurkKizilayi

如果您拥有的是 a str(而不是 a unicode),那么您可以使用以下命令对其进行解码raw_unicode_escape

In [43]: print("T\u00fcrk K\u0131z\u0131lay\u0131 Genel Ba\u015fkan\u0131m\u0131z Sn. @AhmetLutfiAkar yar\u0131n sabah 08:00'e TV8'de canl\u0131 yay\u0131n konu\u011fu olacak... @TurkKizilayi".decode('raw_unicode_escape'))
Türk Kızılayı Genel Başkanımız Sn. @AhmetLutfiAkar yarın sabah 08:00'e TV8'de canlı yayın konuğu olacak... @TurkKizilayi
于 2013-10-02T21:35:24.693 回答
-1

如果您使用的是 Linux,这可能会有所帮助。只需在角色上使用它。

- http://linux.die.net/man/1/iconv - http://www.gnu.org/software/libiconv/

于 2013-10-02T21:34:36.930 回答