我正在尝试创建一个 BASH/Perl 脚本,该脚本将从动态 html 表中获取特定值。
这是我的页面示例
<table border="1" bordercolor="#FFCC00" style="background-color:#FFFFCC" width="100%" cellpadding="3" cellspacing="3"> <tr 对齐=“中心”> <th>环境</th><th>发布轨道</th><th>工件</th><th>名称</th><th>版本号</th><th>Cert Idn</th ><th>Build Idn</th><th>请求状态</th><th>更新时间</th><th>日志信息。</th><th>Initiator</th> </tr> <tr> <td>DEV03</td><td>2.1.0</td><td>abpa</td><td>ecom-abpa-ear</td><td>204</td><td>82113 </td><td>171242</td><td>已部署</td><td>3/18/2013 3:10:58 PM</td><td width="70">日志信息</td> a></td><td>CESAR</td> </tr> <tr> <td>DEV03</td><td>2.1.0</td><td>abpa</td><td>abpa_dynamic_config_properties</td><td>20</td><td>82113</td> <td>167598</td><td>已部署</td><td>3/18/2013 2:32:27 PM</td><td width="70">日志信息</a></ td><td>CESAR</td> </tr> </table>
我的目标是从这个单元格中获取这个值。
“部署”
另一种看待它的方式......
检索“请求状态”列下的所有数据
“已部署”的值是动态的并且可以更改。
我尝试了以下方法:
sed -e 's/>/>\n/g' abpa_cesar_status.txt | egrep -i "^\s*[A-Z]+</td>
" | sed -e 's|</td>||g' | grep Deployed
但这仅适用于“已部署”
有任何想法吗?