0

我有一个关于如何在完成中途发现它不是最佳选择之前处理某个场景的问题。

我在一家大公司工作,该公司有一个团队,该团队为团队成员创建工具,以供他们使用,这些工​​具不是官方的企业工具。我们无法直接访问数据库,只能访问内部服务器来存储我们要运行的文件,并能够使用 javascript 等(相同的域)访问主站点。

我正在研究的是一个工具,其中包含大量选项,可让您选择我将在页面上称为“数据点”的选项。

有诸如“帐户状态、余额、姓名、电话号码、电子邮件等”之类的内容,并将其保存到 Excel 表中。

因此,您输入帐号,选择您需要的内容,然后使用 IE 对象导航到页面并抓取您请求的数据。

我的问题如下..

我想让抓取部分以它的工作方式变得非常动态。我希望能够即时添加新的数据点。

我的目标或想法是使用“数据点选项”存储获取表中特定数据所需的正则表达式。

如果我选择“名称”,它会知道数据库中名称的表达式以再次运行 DOM。在 Javascript / Jquery 中创建这种类型的函数的最佳方法是什么?我需要将正则表达式传递给函数,让它针对 DOM 运行,然后返回结果。

我有一种感觉,有些事情需要超过 1 个步骤才能获取信息等。

我只是在想最好的方法来处理它,而不必将 200 多个表达式硬编码到文件中,因为页面可能会更新并需要更改。

有任何想法吗?

4

1 回答 1

0

IRobotSoft 刮刀可能是您正在寻找的工具。检查这个论坛,看看问题是否与您正在做的类似:http: //irobotsoft.org/bb/YaBB.pl ?board=newcomer 。这是免费的。

它使用的不是正则表达式,而是一种叫做HTQL的语言,可能更适合提取网页。它也支持正则表达式,但不作为主要语言。

它通过可视化界面很好地组织您的所有操作,因此您可以动态组合操作或任务以满足不断变化的需求。

于 2013-08-01T13:08:42.600 回答