ruby-on-rails - ruby spidr 无法抓取“gb2312”编码 html 页面

翻译自：https://stackoverflow.com/questions/18468498 2013-08-27T14:38:21.310

134 次

为什么 ruby spidr 不能爬出“gb2312”编码的 html 页面？它只能蜘蛛“utf-8”编码页面吗？这是我的代码：

Spidr.site('http://www.lookmw.cn/') do |spider|
  spider.every_page do |page|
    puts "[-] #{page.url}"

  end
end

它回答：“编码错误：由于输入错误，输入转换失败，字节 0xAB 0x69 0xA3 0xAC”我该怎么办？

0 回答 0