0

我有我客户的电子商店,它是由另一家公司创建的。我想解析所有产品并将它们放在 xml 中。我知道如何到达每个“品牌”的第一页,但我很难通过参数来更改分页结果的页面。

这是指向一个品牌的电子商店“ http://www.gialia.net.gr/P ​​roductCatalog/20/CAR.aspx”。

当我在 firefox 上使用 tamper-data 时,我看到当您想按结果的第二页时,会发布:

"__EVENTTARGET=ctl00%24wpmMain%24wp131820866%24wp512420601%24dpgTop%24ctl01%24ctl01"

最后一个字符串:“ct101”表示转到第 2 页,如果我将其更改为 ct102,则转到第 3 页等。

但是我正在尝试将其创建为 GET 请求,因此我可以在我的 Java 代码中动态创建这些参数并解析每个响应。但是当我将网址创建为:

http://www.gialia.net.gr/ProductCatalog/20/CAR.aspx?__EVENTTARGET=ctl00$wpmMain$wp131820866$wp512420601$dpgTop$ctl01$ctl02  

我没有得到任何结果。

有人可以看看并给我一些建议吗?

4

1 回答 1

0

您在这里给我们的网站在搜索引擎(SEO)方面的设计非常糟糕,因此页面的解析太难了。

更改页面是回发,并且仅使用 javascript。因此,您必须执行相同操作才能移至目录的下一页,您需要使用所有参数对页面进行完整的回传。

现在,页面设计太糟糕了,程序员禁用了__EVENTVALIDATION控件可能是因为他不让他做错事,所以当你可以篡改数据时,你仍然需要回发。通过在 url 上简单输入一个参数,后面的代码不理解就是回发。您需要至少发送 Viewstate 和其余隐藏参数。

但是从您的客户端直接访问数据库并从那里读取它们不是更容易吗?

于 2013-02-09T09:31:32.237 回答