我有一个包含产品列表的 csv 文件,我想自动从它们中抓取数据。
我创建的 rpa 机器人能够使用我在电子商务网站上的列表重复搜索产品。它将搜索直到使用列表中的每个产品名称。但是,机器人只会从我的 csv 列表的第一个产品中抓取数据,并编写一个新的 csv 文件来存储抓取的数据。抓取第一个产品后,机器人将继续搜索第二个产品,以及第三个和第四个产品,并编写一个新的 csv 文件。但是,当我打开第二个产品的 csv 文件时,数据与第一个产品的数据抓取完全相同。这表明 rpa 机器人在搜索第二个产品时没有进行数据抓取。为什么会这样?
提取元数据的 XML 代码,来自提取结构化数据 DIV
<row exact='1'>
<webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
<webctrl tag='div' idx='2'/>
<webctrl tag='div' class='ProductGrid-container' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-container'/>
<webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
</row>
<column exact='1' name='item' attr='text' name2='item's url' attr2='href'>
<webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
<webctrl tag='div' idx='2'/>
<webctrl tag='div' class='ProductGrid-container' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-container'/>
<webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
<webctrl tag='h4' class='RedmartProductCard-title' idx='1'/>
</column>
<column exact='1' name='current price' attr='text'>
<webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
<webctrl tag='div' idx='2'/>
<webctrl tag='div' class='ProductGrid-container' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-container'/>
<webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-priceContainer' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-price sg' idx='1'/>
</column>
<column exact='1' name='quantity' attr='text'>
<webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
<webctrl tag='div' idx='2'/>
<webctrl tag='div' class='ProductGrid-container' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-container'/>
<webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-weight' idx='1'/>
</column>
<column exact='1' name='amount of rating' attr='text'>
<webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
<webctrl tag='div' idx='2'/>
<webctrl tag='div' class='ProductGrid-container' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-container'/>
<webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
<webctrl tag='div' class='RedmartProductCard-footerContainer' idx='1'/>
<webctrl tag='div' class='Rating-container' idx='1'/>
<webctrl tag='div' class='Rating-review' idx='1'/>
</column>
</extract>