0

我正在尝试从网站上抓取,但 iMacro 不加载页面。网址转到=http://www.grosshandel-produkte.com/adressen/detail/id/13500

在 Firefox 17 Web 控制台上出现错误提示,

GET http://www.grosshandel-produkte.com/adressen/detail/id/13500 [HTTP/1.0 500 内部服务器错误 598ms]

未声明 HTML 文档的字符编码。如果文档包含 US-ASCII 范围之外的字符,则文档将在某些浏览器配置中呈现乱码。页面的字符编码必须在文档或传输协议中声明。

有没有办法在 iMacros 中强制执行字符集?我尝试更改浏览器字符集。它也没有用。该网站是德国的。我尝试了 utf-8,但没有用。

请帮忙。

4

1 回答 1

0

使用 smartsniff 或 Fiddler2 并正常导航到该站点,它们会告诉您在尝试加载站点并识别故障时使用什么编码等。

GET http://www.grosshandel-produkte.com/adressen/detail/id/13500 HTTP/1.1
Host: www.grosshandel-produkte.com
Connection: keep-alive
Cache-Control: max-age=0
User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.97 Safari/537.11
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-GB,en-US;q=0.8,en;q=0.6
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: symfony=9pebil173uvj7j4r61ntbu3072; __utma=21097197.1518127093.1358333525.1358333525.1358333525.1; __utmb=21097197.0.10.1358333525; __utmc=21097197; __utmz=21097197.1358333525.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)

回应是:

HTTP/1.1 200 OK
Date: Wed, 16 Jan 2013 10:53:09 GMT
Server: Apache
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
P3P: CP="ALL CURa ADMa DEVa TAIa OUR BUS IND PHY UNI PUR COM NAV INT DEM"
X-Powered-By: PleskLin
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=utf-8

分块响应:P

于 2013-01-16T10:53:54.827 回答