0

因此,我在电子表格中有很多数据,我需要取一个值(一个数字)并将其输入到供应商给我的订购单中的 Web 表单中。这样我就可以将它添加到我的订单中。但是,我有数千个不同的参考编号,需要弄清楚最好的方法是什么。它们是脚本、vbs 还是可以从 csv 文件中提取这些值的代码,将它们运行到表单中,返回第一组值,然后返回表单并在 EOF 之前再次执行此操作?

这是表格的样子:

<div align=center>
Please enter an item number: <br>
<input type="text" name="search_number" value="" size="10" maxlength="8">
<input TYPE="SUBMIT" VALUE="Go" NAME="Action">

这是返回内容的一部分....或者我真正关心保留/解析的部分

<div id="grids">
<table cellspacing=0 cellpadding=0 width=100% border=0><tr height=30 bgcolor=#FFD700>                             
<td>  
<font face=arial size=-1 color=000000>&nbsp;<b>
Style #5095 - APPLAUSE-LEOTARD (Page 5D)
</b></font></td></tr><tr height=5><td></td></tr></table>
<table> 
<tr><th></th><th>SC</th><th>INT</th><th>MC</th><th>LC</th><th>XLC</th><tr><td></td><td               
align=center><small>$27.95</small></td><td align=center><small>$27.95</small></td><td    
align=center><small>$27.95</small></td><td align=center><small>$27.95</small></td><td   
align=center><small>$31.95</small></td></tr>
<tr><td><small> (001)</small></td>
<td><input type="text" name="stq-5095-2-001" value ="" size="4" maxlength="4" 
onfocus="this.select()"></td>
<td ><input type="text" name="stq-5095-3-001" value ="" size="4" maxlength="4"   
onfocus="this.select()"></td>
<td ><input type="text" name="stq-5095-4-001" value ="" size="4" maxlength="4"    
onfocus="this.select()"></td>
<td ><input type="text" name="stq-5095-5-001" value ="" size="4" maxlength="4"    
onfocus="this.select()"></td>
<td ><input type="text" name="stq-5095-6-001" value ="" size="4" maxlength="4"  
onfocus="this.select()"></td>
</tr>
</table>

最后,我想从每个返回值中看到的是样式编号(我搜索过的),它的大小......以及每个到电子表格的价格。这是它现在返回的内容。必须进行 photobucket 共享以便我可以发布此 bc 堆栈溢出要求我在发布图像之前拥有 10 的声誉。

http://s1159.photobucket.com/albums/p622/dcolnar/

我只需要价值和价格。它还会返回与样式#5095F、样式#5095S 密切匹配的结果,但是对于这些我在电子表格中有自己的行。所以搜索无论如何都会返回它们。所以不需要在这里复制这些值。

获得该信息后,我需要返回上一页(我只是在浏览器上使用返回键)并在表单中提交下一个值。(需要删除那里的值......或取决于你如何做......只需使用新值提交)

如果您能够给我代码或给我有关获得这些价值的最佳方式的信息,那就太好了。我真的希望我的供应商能给我发一份他们的数据库表的副本……这样会容易得多。我必须登录才能使用这个工具,他们已经提供了,但是一旦登录,我就不必重新登录来进行多次搜索。仅当我关闭浏览器(结束会话)时,我才被要求重新提交登录凭据

谢谢你提供的所有帮助。

4

1 回答 1

0

我会使用 python 来自动化这个过程:

  1. 使用 python 模块openpyxl从电子表格中提取数据。
  2. 使用 python 模块Mechanize自动完成网页导航以及表单完成和提交。
  3. 使用 python 模块BeautifulSoup解析返回的 HTML 并获取您需要的数据。

其他选择:

  1. Perl 具有与上述 python 模块类似的模块。
  2. 电源外壳
  3. 其他点网语言
于 2012-09-05T22:39:56.007 回答