我想要得到的网页有 windows-1251 字符集编码。有没有一种方法不仅可以简单地下载此页面,而且可以自动.. 嗯.. 将里面的文本转换为 uft-8?
我试图向 wget 添加其他参数,例如
--header='Accept-Charset: utf-8'
但没有运气。
我想要得到的网页有 windows-1251 字符集编码。有没有一种方法不仅可以简单地下载此页面,而且可以自动.. 嗯.. 将里面的文本转换为 uft-8?
我试图向 wget 添加其他参数,例如
--header='Accept-Charset: utf-8'
但没有运气。
您可以使用
iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html
转换编码。见https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encoding