-1

有谁知道如何下载页面,例如:

http://www.zvz.co.il/SingleAd.aspx?p=76755307&t=11&m=p

当我这样做时,我在标题中得到了这个:

<head id="Head1"><title> 
×–×”-וזה - רכב: מ×זדה ל×× ×˜×™×¡ 323 תת ×“×’× glx ×וטו' â€1800, ×©× ×ª 1996, 8,000 ₪ , ת. ×”×™×œ×•×›×™× ×וטומטית, יד ר××©×•× ×”, ×זור ×™×™×©×•×‘×™× ×•×ž×•×©×‘×™× ×‘×“×¨×•× ×‘×¤×ª×— תקווה, ×ž× ×•×¢ 1,840 סמ"ק, ×ž× ×•×¢ ×‘× ×–×™×Ÿ, צבע כסף, מס' ק"מ 210,000, בעלות × ×•×›×—×™×ª פרטית, הערות מצב ×ž×›× ×™ מעולה 
</title><link rel="Stylesheet" type="text/css" href="1.css" /> 

但真正存在的是:

<head id="Head1"><title>
    זה-וזה - רכב: מאזדה 2, שנת 2009, 80,000 ₪ , ת. הילוכים אוטומטית, יד שנייה, אזור רמת גן - גבעתיים ברמת גן, מנוע 1,400 סמ"ק, מנוע בנזין, צבע שחור, מס' ק"מ 30,000, בעלות קודמת פרטית, בעלות נוכחית פרטית, הערות שמורה ומתוחזקת.טסט לשנה(יוני 13).2 צמיגים קדמיים חדשים.בקיצור אחלה רכב עם מעט ק"מ.לרציניים בלבד., תוספות מערכת אבטחה של קוברה.מפוארת., טסט הבא 29/06/2013
</title><link rel="Stylesheet" type="text/css" href="1.css" />

我需要一些特殊的字符编码吗?我使用标准的 Php & cUrl 来做一个简单的网络请求和下载。请帮忙。

4

1 回答 1

0

有一些类似的线程可能对您有所帮助:

R:从使用 RCurl 抓取的网页中提取“干净”的 UTF-8 文本

使用“cat”将非英文字符写入 .html 文件(在 R 中)

本质上不一样,但可能有帮助。

于 2013-01-17T16:08:43.063 回答