我收集了一堆推文并将它们输出到命令行,这是我得到的:
推文有不同的语言,所以我怀疑我也有阿拉伯语的。控制字符可以负责此输出吗?有几千行,不知何故被压缩成一条,据我所知,字符相互重叠。
到底是怎么回事?
我收集了一堆推文并将它们输出到命令行,这是我得到的:
推文有不同的语言,所以我怀疑我也有阿拉伯语的。控制字符可以负责此输出吗?有几千行,不知何故被压缩成一条,据我所知,字符相互重叠。
到底是怎么回事?
根据默认的文本编码和系统的语言环境,您的数据将在打印到控制台时被解释。
我宁愿看一下您收到的十六进制数据,即:0x4142430d0a... 而不是 Unicode、UTF 或您的系统使用的任何文本编码。
甚至可以在http://en.wikipedia.org/wiki/Character_encoding上找到关于不同文本编码的介绍