1

有时在编码的世界中会发生奇怪的事情,我根本无法解释。:)

我拥有的文本文件包含以下几行:

en …π 1 1
en Ψ 1 1
en Ω 1 1
en –° 1 1
en —† 1 1
en Ҥ 1 1
en ◊° 2 2
en Ḥanīf 1 1
en ·π_ 1 1
en ˝mage:whiteshark-tgoss1.jpg 4 4
en ˝stanbul 114 114

我的代码如下:

var fileReadStream = fs.createReadStream(fileName, {encoding: 'utf8'});
fileReadStream.on('data', function(data){
  //do something with the data
});

当我查看数据元素时,所有疯狂的 unicode 字符都被替换为 �s。IE:

en �� 1 1
en �� 1 1
en �� 1 1
en �� 1 1
en �� 1 1
en �� 1 1
en �� 2 2
en ���an��f 1 1
en ��_ 1 1
en �mage:whiteshark-tgoss1.jpg 4 4
en �stanbul 114 114

我也尝试过设置没有将编码设置为 UTF8 的 ReadStream,但没有运气。

var fileReadStream = fs.createReadStream(fileName);

为什么会这样?

4

0 回答 0