0

所以假设我们有一个这样的字符串:

‰û]M§Äq¸ºþe Ø·¦ŸßÛµÖ˜eÆÈym™ÎB+KºªXv©+Å+óS—¶ê'å‚4ŒBFJF󒉚Ү}Fó†ŽxöÒ&‹¢ T†^¤( OêIº ò|<)ð

我如何将它变成人类可读的字符字符串,因为它就像是来自网络服务器的 HTML 的奇怪输出,我认为它是文本,因为一半的网页加载正确。我是否需要用 C 或 Python 之类的东西来阅读它。这只是字符串的一小部分。

4

2 回答 2

1

如果这实际上应该是人类可读的字符串,那么您需要弄清楚它使用什么字符编码并进行翻译。字符串也可能被压缩、加密或表示二进制数据。知道你从哪里得到你的字符串会很有帮助。

于 2010-01-14T23:21:32.253 回答
0

我猜你的网络服务器没有发送正确的 mime 类型。我建议使用 Firefox 的 Live Headers 插件查看 http 标头。如果 Web 服务器决定向您发送 pdf,但未设置 mime 类型,您只会在屏幕上看到垃圾。或者,将页面保存到文件中,然后从 Cygwin 或 unix shell 运行这些命令:

file mypage.htm
strings mypage.htm

第一个将告诉您标头字节是否遵循任何可识别的模式。第二个将剥离并显示所有人类可读的文本。

于 2010-01-14T23:32:05.893 回答