我正在使用 Node.js 从 Windows-1255 编码的网页中提取文本。我正在尝试使用windows-1255解码文本。
在使用 NPM 安装它并在相关文件中要求它之后,我尝试像这样使用它:
var title = windows1255.decode('#title').text());
这似乎没有任何效果。知道为什么吗?
谢谢!
摩根
我正在使用 Node.js 从 Windows-1255 编码的网页中提取文本。我正在尝试使用windows-1255解码文本。
在使用 NPM 安装它并在相关文件中要求它之后,我尝试像这样使用它:
var title = windows1255.decode('#title').text());
这似乎没有任何效果。知道为什么吗?
谢谢!
摩根
不知道您是否仍在等待有关此问题的答案,但是以下内容对我有用...
在获取数据(文件)时,我将编码的获取选项设置为二进制:
var options = {
method: 'GET',
url: 'myURL',
encoding: 'binary'
};
request(options, function (error, response, body) {
//deal with hebrew encoding
csvString = encoding.convert(body, 'UTF8', "CP1255").toString();
然后我将编码从CP1255
(= windows1255
) 切换到UTF8
.
希望能帮助到你 :)