我想废弃一个网站 并提取商品的以下价格,但同一商品有多个价格我如何正确过滤掉商品的价格..
这是解析 page=1 上商品价格的代码:
hxs.select("//div[@class='category-products']/ul/li//div[@class='price-box']//span[@class='price']").extract()
这使 :
[u'<span class="price" id="old-price-8963">\n \u20b9 8,990 </span>',
u'<span class="price" id="product-price-8963">\n \u20b9 5,990 </span>',
u'<span class="price" id="old-price-8940">\n \u20b9 8,990 </span>',
u'<span class="price" id="product-price-8940">\n \u20b9 5,990 </span>',
u'<span class="price">\u20b9 7,990</span>',
u'<span class="price">\u20b9 7,990</span>',
u'<span class="price">\u20b9 7,990</span>',
u'<span class="price">\u20b9 7,990</span>',
u'<span class="price">\u20b9 7,990</span>',
u'<span class="price">\u20b9 2,990</span>']
前两个价格是相同物品的……第二个物品的价格也是如此……但其余的只是一个价格……有人能建议我解决这个问题的方法吗……