为什么 ruby spidr 不能爬出“gb2312”编码的 html 页面?它只能蜘蛛“utf-8”编码页面吗?这是我的代码:
Spidr.site('http://www.lookmw.cn/') do |spider|
spider.every_page do |page|
puts "[-] #{page.url}"
end
end
它回答:“编码错误:由于输入错误,输入转换失败,字节 0xAB 0x69 0xA3 0xAC”我该怎么办?
为什么 ruby spidr 不能爬出“gb2312”编码的 html 页面?它只能蜘蛛“utf-8”编码页面吗?这是我的代码:
Spidr.site('http://www.lookmw.cn/') do |spider|
spider.every_page do |page|
puts "[-] #{page.url}"
end
end
它回答:“编码错误:由于输入错误,输入转换失败,字节 0xAB 0x69 0xA3 0xAC”我该怎么办?