我有一个 cURL Bash 脚本,它可以访问网站并发布数据,然后将其返回到文本文件。文本文件全部以 HTML 格式返回,我不知道如何从中提取我需要的信息。这是来自Info.txt的 HTML :
<table cellspacing="1" cellpadding="0" border="0">
<tr><td><img src="/themes/img/status/green.gif" width="12" height="12" border="0"/></td><td><font class="small"><i>October 15, 2013 @ 1:34pm (PST)</i></font></td></tr>
<tr><td><font class="small">MF: </font></td><td><font class="small">PSVBHP9001230079779201</font></td></tr>
<tr><td><font class="small">SN: </font></td><td><font class="small">1354716309166</font></td></tr>
<tr><td><font class="small">ID: </font></td><td><font class="small">800.10</font></td></tr>
</table>
我需要提取这三个值:
- PSVBHP9001230079779201
- 1354716309166
- 800.10
我已经尝试过使用 grep,但没有取得太大的成功。我似乎无法弄清楚如何只提取我想要的值。我也尝试了多个 sed 和 awk 命令,但最接近的是使用这个 grep 命令:
$ grep -o '[^ ]*.PSV[^ ]*' Info.txt
<tr><td><font>PSVBHP9001230079779201</font></td></tr>