2

我正在使用网络收获。但是,我想从 URL 中抓取数据:

http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=×tamp=1363305908912

我的代码是:

<?xml version="1.0" encoding="UTF-8"?>

<config>
    <var-def name="google">
    <html-to-xml>
    <http url="http://derstandard.at/anzeiger/immoweb/Suchergebnis.aspx?Regionen=9&Bezirke=&Arten=&AngebotTyp=&timestamp=1363305908912"></http>
    </html-to-xml>
    </var-def>
</config>

但是我得到:

对实体 Bezirke 的引用必须以“;”结尾

我不明白网络收获是什么意思,带有';'?

4

2 回答 2

1

您应该在您的网址中编码与符号,即。改变每&一个&amp;

于 2013-04-26T11:04:09.630 回答
1

我不太了解网络收集,但他们的例子有:

<xpath expression="//a[@shape='rect']/@href">
    <html-to-xml>
        <http url="http://www.somesite.com/"/>
    </html-to-xml>
</xpath>

<http url =".." />

而你的代码有

<http url = ".."></http> 

也许这是你的问题?不需要结束标签

于 2013-03-15T00:17:03.507 回答