5

我想要得到的网页有 windows-1251 字符集编码。有没有一种方法不仅可以简单地下载此页面,而且可以自动.. 嗯.. 将里面的文本转换为 uft-8?

我试图向 wget 添加其他参数,例如

--header='Accept-Charset: utf-8'

但没有运气。

4

1 回答 1

5

您可以使用

iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html

转换编码。见https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encoding

于 2013-03-30T19:07:12.467 回答