当我通过 Node.js请求下载页面内容并且内容由ISO-8859-2编码时,无法将其转换为UTF-8。
我正在使用node-iconv。
代码:
request('https://www.jakpsatweb.cz', function(err, resp, body){
const title = regexToRetrieveTitle(body);
const iconv = new Iconv('ISO-8859-2', 'UTF-8');
const buffer = iconv.convert(title);
console.log(buffer);
console.log(buffer.toString('UTF8'));
})
安慰:
<Buffer 52 65 6b 6c 61 6d 61 3a 20 6a 61 6b 20 66 75 6e 67 75 6a 65 20 77 65 62 6f 76 c4 8f c5 bc cb 9d 20 72 65 6b 6c 61 6d 61>
Reklama: jak funguje webovďż˝ reklama
预期结果:
Reklama: jak funguje webová reklama
有谁知道问题出在哪里?
编辑:
例如,我下载THIS PAGE。我通过元标记(chrome 浏览器)识别了 ISO-8859-2,我需要转换页面内容并保存到数据库。我的数据库是 UTF-8,因此我需要对其进行编码。