1

我对 iMacro 脚本的世界非常陌生,因此我很难(我相信)一个非常简单的数据抓取工作。

我希望抓取的网站包含一个索引页面(一个表格,每个新行都是一个指向产品页面的超链接),然后是产品页面(每次都使用相同的格式)。我希望宏执行以下操作....

  1. 单击第一个超链接(表格行,即。POS1
  2. 页面加载后,抓取 10 个字段(将始终位于每页的相同位置)
  3. BACK(到索引页)
  4. 向下递增到下一个超链接(下一个表格行,即。POS2
  5. 提取数据并重复
  6. 将数据导出为单个文件/csv,每组抓取的数据为新行/行

这是我到目前为止所拥有的......(链接已删除,因为它需要登录)

VERSION BUILD=7401598
TAB T=1
TAB CLOSEALLOTHERS
URL GOTO=https://XXXXXXXXXXXX
TAG POS={{!loop}} TYPE=TD FORM=ID:form1 ATTR=TXT:*
TAG POS=8 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=6 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=20 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=24 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=22 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=34 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=38 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=42 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=46 TYPE=TD FORM=ID:form1 ATTR=TXT:* EXTRACT=TXT
TAG POS=66 TYPE=TD FORM=ID:form1 ATTR=CLASS:labelBold EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=C:\iMacrosExports\ FILE=Extract_{{!NOW:ddmmyy_hhnnss}}.csv
WAIT SECONDS=2
BACK

上面的脚本仅从第一个产品页面收集数据,并将其导出为多个 CSV(但是我多次声明它循环)。

任何帮助将不胜感激。如果您需要更多信息,请告诉我。

4

1 回答 1

1

你的宏看起来不错。我只会在最后删除 BACK 命令,因为您有 URL GOTO 在每个循环中导航回索引页面。只要您使用“播放(循环)”按钮,它应该可以工作......

如果您手动增加 P​​OS 的值,宏是否有效?我的意思是,您首先运行一个 POS=1 的宏(而不是 {{!loop}},然后再次使用 POS=2,依此类推。

如果您有问题,您也可以直接写信至 support@iopus.com 或在iMacros 论坛中发布您的问题。

问候,

玛西娅

于 2011-08-18T19:59:40.960 回答