0

我必须从某些网站上抓取产品的图像,我正在使用 javascript 来抓取它。到目前为止,我已经成功地抓取了图像,如下所示

var  images = document.images;

for (var i = 0; i < images.length; i++) {
    img =  images[i];

我也想从文件中刮掉价格。我知道这是可能的,一些网站已经在这样做,但不确定如何。通过文档文本匹配“价格”字符串似乎是一种可能性,但不确定如何做到这一点,还有没有更好的方法。任何指针?

4

1 回答 1

1

这取决于您对相关页面的了解程度。如果你是盲目的,你总是可以使用一些可怕的document.body.innerHTML.match(/£\d+\.\d+/g)东西(或类似的东西,取决于货币)。无论哪种方式,您都希望在页面中查找和匹配模式并从那里获取价格。

奖励积分:看看他们是否有谷歌基础提要(未受保护) - 你会惊讶于有多少人这样做。这将(通常)是一个 XML 提要,其中包含您可能需要的一切。

于 2012-04-19T20:22:54.843 回答