我想使用 bash 脚本获取网站的编号。我首先 wget 网页,然后尝试解析页面并获取数字。
index.html 有一长行包含我想要的数字。
(...) </dl><dl class=""><dt>Year <dd> <a title="City" href="http://example.com/City">City</a> <em>(400)</em> </dd><dd> (...)
我想在上面的例子中得到400 。我正在执行以下操作,但不匹配:
CITYNUMBER=`sed -n -e 's/.*City<\/a>\s<em>(\(.*?\))<\/em>/\1/p' index.html`