作为对网页的响应,我收到了一些奇怪的字符。我很确定它是俄语的信息,但编码似乎很奇怪。网页信息告诉我编码是 ISO-8859-1。这是示例响应。
Âû ñòðàíè÷êå ïðåâüþøêàìè
有没有办法解密这个响应?响应是否可以挽救。
作为对网页的响应,我收到了一些奇怪的字符。我很确定它是俄语的信息,但编码似乎很奇怪。网页信息告诉我编码是 ISO-8859-1。这是示例响应。
Âû ñòðàíè÷êå ïðåâüþøêàìè
有没有办法解密这个响应?响应是否可以挽救。
看起来编码实际上是 Cyrillic Windows-1251。相应地切换您的网络浏览器编码。
例如,您在该编码中提供的文本是:
Вы страничке превьюшками
自动翻译的意思是“您的页面预览”。
几乎不可能自动识别 8 位编码,因为所有字节组合在技术上都是有效的。在这种情况下,我很确定它是Windows-1251,因为那里的字符非常有意义:
Вы страничке превьюшками
这显然不是 ISO-8859-1。
要将其转换为 Unicode 字符串,请使用以下decode
方法:
b = "Âû ñòðàíè÷êå ïðåâüþøêàìè".encode("Latin-1") # simulate the incoming byte string
u = b.decode("Windows-1251")
print(u)