0

我有一个包含产品列表的 csv 文件,我想自动从它们中抓取数据。

我创建的 rpa 机器人能够使用我在电子商务网站上的列表重复搜索产品。它将搜索直到使用列表中的每个产品名称。但是,机器人只会从我的 csv 列表的第一个产品中抓取数据,并编写一个新的 csv 文件来存储抓取的数据。抓取第一个产品后,机器人将继续搜索第二个产品,以及第三个和第四个产品,并编写一个新的 csv 文件。但是,当我打开第二个产品的 csv 文件时,数据与第一个产品的数据抓取完全相同。这表明 rpa 机器人在搜索第二个产品时没有进行数据抓取。为什么会这样?

.CSV 产品列表 过程的形象 写入 CSV 属性 提取结构化数据“DIV”属性

提取元数据的 XML 代码,来自提取结构化数据 DIV

    <row exact='1'>
        <webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
        <webctrl tag='div' idx='2'/>
        <webctrl tag='div' class='ProductGrid-container' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-container'/>
        <webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
    </row>
    <column exact='1' name='item' attr='text' name2='item&apos;s url' attr2='href'>
        <webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
        <webctrl tag='div' idx='2'/>
        <webctrl tag='div' class='ProductGrid-container' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-container'/>
        <webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
        <webctrl tag='h4' class='RedmartProductCard-title' idx='1'/>
    </column>
    <column exact='1' name='current price' attr='text'>
        <webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
        <webctrl tag='div' idx='2'/>
        <webctrl tag='div' class='ProductGrid-container' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-container'/>
        <webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-priceContainer' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-price sg' idx='1'/>
    </column>
    <column exact='1' name='quantity' attr='text'>
        <webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
        <webctrl tag='div' idx='2'/>
        <webctrl tag='div' class='ProductGrid-container' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-container'/>
        <webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-weight' idx='1'/>
    </column>
    <column exact='1' name='amount of rating' attr='text'>
        <webctrl tag='div' class='ant-col-20 ant-col-push-4 c1z9Ut' idx='1'/>
        <webctrl tag='div' idx='2'/>
        <webctrl tag='div' class='ProductGrid-container' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-container'/>
        <webctrl tag='a' class='RedmartProductCard-link' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-content' idx='1'/>
        <webctrl tag='div' class='RedmartProductCard-footerContainer' idx='1'/>
        <webctrl tag='div' class='Rating-container' idx='1'/>
        <webctrl tag='div' class='Rating-review' idx='1'/>
    </column>
</extract>
4

1 回答 1

1

将活动清除数据表写入 .csv 文件后使用。它可能对你有用。

当您使用循环时,它可能不会覆盖某些时间。

于 2020-05-14T08:47:18.417 回答