我使用 wget 下载与 Academic.google.com 中给定查询匹配的论文数量,并获得一个显示页面所有内容的文件。
我想检索文件“大约 8,890 的结果 1 - 10”以下部分中的最后一个数字。
我试过了:
cat /dir/file | tr -d "," | grep -o -E -- 'about ([^"]+) \w+'
但它输出:
about <b>8890</b>. (<b>0.12</b> sec) </font></td></tr></table></form> <div class
而我只想要8890(没有逗号,由 tr -d ","
关于如何改进它的任何建议?先感谢您!