1

我正在使用 Node.js 从 Windows-1255 编码的网页中提取文本。我正在尝试使用windows-1255解码文本。

在使用 NPM 安装它并在相关文件中要求它之后,我尝试像这样使用它:

var title = windows1255.decode('#title').text());

这似乎没有任何效果。知道为什么吗?

谢谢!

摩根

4

1 回答 1

1

不知道您是否仍在等待有关此问题的答案,但是以下内容对我有用...

在获取数据(文件)时,我将编码的获取选项设置为二进制:

var options = {
        method: 'GET',
        url: 'myURL',
        encoding: 'binary' 
    };

    request(options, function (error, response, body) {

        //deal with hebrew encoding
        csvString = encoding.convert(body, 'UTF8', "CP1255").toString();

然后我将编码从CP1255(= windows1255) 切换到UTF8.

希望能帮助到你 :)

于 2016-04-03T17:00:07.493 回答