我正在研究通用网店刮刀,遇到了奇怪的问题。实际上,我需要网页上列出的所有产品的正确 URL。大多数时候,这些产品的 href 是相对的。
我正在使用新的 Uri 方法来创建完整的产品 URL。
new Uri (base, href)
//this actually decide to add "/" before product href
href = x.ProductHref.IsUrlAbsolute() ? x.ProductHref : ((x.ProductHref.StartsWith("/") || (x.ProductHref.StartsWith("."))) ? x.ProductHref : "/" + x.ProductHref)
失败的结果:如何纠正这个
Base URL: "www.bebitalia.it/Products/ProductList_it.html#filter&.CHAISE_LONGUE"
Product href: Product-landscape-chaise_longue_118_it.html
Result : http://www.bebitalia.it/Product-landscape-chaise_longue_118_it.html ==> Status Wrong
Expected: http://www.bebitalia.it/Products/Product-landscape-chaise_longue_118_it.html
我试图纠正它,但它不适用于其他人:)。想让它通用。请提出任何解决方案,我需要正确的方向或更好的方法。