我正在尝试编写一个可以从大型 html 文件中提取信息的 bashscript。我需要这个来每天早上自动下载最新的报纸:)。要下载最新的报纸,我必须知道它的 ID。为了得到它,我必须解析指向它的链接。我设法提取了这条线,它用 awk 保存了 id
awk '/show.php\?id=/' index.html
并得到
<a href="show.php?id=914826">Latest Newspaper</a>
所以我需要的是“914826”。这就是我卡住的地方......我不认为我可以使用 awk 来提取不是整行,而是一个片段。
期待您的回答。在此先感谢,西蒙