1

首先,我将介绍一些有关情况的背景。我有一个包含大约 56k 页的网站,每个页面都包含机器零件的映射草图。该机器部件由较小的部件制成,这些部件在图像中勾勒出来并具有一定的数量。当您将鼠标悬停在数字上时,会出现一个带有零件项目代码的框。

我根据此项目代码订购零件,但最近很多项目代码已更改,因此我正在寻找解决方案。

现在我拥有一个包含所有 56k 部件数据的数据库,我想根据部件的名称(我数据库中的一列)将相关网页链接到每条记录,问题是网页名称没有逻辑名称可以以任何方式与零件名称连接,但页面中显示的图像具有零件的确切名称。

我想根据其中显示的图像重命名我拥有的所有 html 文件。如何在不手动重命名所有 56k 页面的情况下实现这一目标?

另外,在完成上述所有操作后,如何将所有 56k 页面的链接自动添加到我的数据库中?

谢谢你的耐心,我知道它很长。

4

2 回答 2

1

如果你有一个 *nix shell,那么一个简单的程序egrep会让你走得更远

egrep "<img src=\".*\"" -r . > list

当然,必须调整正则表达式以匹配您正在寻找的部分。

您可以轻松地在结果列表中进行一些搜索/替换,以创建一个批处理脚本,该脚本将为您完成所有重命名。

于 2010-12-28T17:57:38.330 回答
0

选择您最喜欢的脚本语言并解析每个 html 文件以找到用于重命名文件的图像名称。就我个人而言,我会使用 Perl,因为它使解析文件和更新数据库的同时使用 URL变得容易

于 2010-12-28T18:01:32.697 回答