我正在尝试使用 cfhttp 拉出一个页面以从中解析信息。我正在调用的页眉是:
内容编码:gzip
连接:保持活动
内容长度:19066
服务器:IBM_HTTP_Server
变化:Accept-Encoding、User-Agent
内容语言:en-US
缓存控制:no-cache="set-cookie,
设置cookie2"
内容类型:
文本/html;charset=ISO-8859-1
我将字符集设置为 ISO-8859-1,但是我在 FileContent 中得到了以下内容(下面只显示了一个小示例,但我认为它可以指出)。
EðÑq·Oã?·Ì\ZóL¯þ´Vú5ðbä£ÿæ¾_HÉÒñQãO\Çþãë85ÁÜ à±°ùÖ}&bßý?,u?2SùQyk5g?UÛ3Ѹfã×ARÃ_i_iûRã _ òCA¿-ß。
"b /¯ßíWÝÆ´}w~,°iøÜCáÇþ@ÃZ5¤ïsÁ8½°ì* ZÜéjOÝK/Ë4§ÈG5×ä*¬6ÚwÇ0]ã:àÑþé¬G"ÅÁl/t° jlá»5¶&¯lìYìºØ'yDð½|#ý<ñìTé%¾ï¬ùƪx¶}«±o9»ë¼ÂÆÒï'w8Y?
÷ðxsllû 6íqüGÞsÜóÀx·ªk®XºàåZ{íÁ½åo÷mbq¥ÝÃ8M
我尝试了其他字符集,并正在考虑 gzip 编码导致问题,但我不确定如何测试是否是问题。任何建议或帮助将不胜感激。
下面是我的代码
<cfhttp
METHOD="get"
throwonerror="yes"
CHARSET="ISO-8859-1"
URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10">
<cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
</cfhttp>
<cfset listings = #cfhttp.FileContent#>
<cfoutput>
#listings#
</cfoutput>
我也尝试过标题:
<cfhttpparam type="Header" name="Accept-Encoding" value="*">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
并尝试删除“Accept-Encoding”标头并离开 TE。
更新: 我还没有弄清楚,但我发现了一些可以帮助别人帮助我的东西。当我使用我的测试 php 服务器在同一页面上运行 file_get_contents 并且它工作正常时,如果我运行相同的 cfhttp 代码来调用正在调用我需要的页面的 php 页面,它工作得很好。感谢您迄今为止的建议。