我应该使用什么命令从以下 html 代码中提取文本,该代码位于“test.html”文件中,其中包含:“ <span id="imAnID">extractme</span>
”?
该文件会更大,所以我需要将 grep 或 sed 指向一个 id,然后告诉它只从具有此 ID 的标签中提取文本。假设我从文件所在的目录运行终端,我这样做:
cat test.html | sed -n 's/.*<span id="imAnID">\(.*\)<\/span>.*/\1/p'
我究竟做错了什么?我得到一个空输出......如果它更容易,不反对使用 grep 。