4
$ lynx --dump -listonly index.html

示例结果:

References

Visible links
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
3. http://lynx.invisible-island.net/current/index.html

我想要做的是删除包含的 1. 2. 和 3.“参考”和“可见链接”文本。

想要的结果:

http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
http://lynx.invisible-island.net/current/index.html
4

3 回答 3

12

您可以使用Lynx 的-nonumbers选项

lynx --dump -nonumbers -listonly http://lynx.invisible-island.net/
于 2018-05-10T08:21:28.817 回答
0

尝试:

lynx --dump -listonly index.html | sed -r 's/^[0-9]+\. //'
于 2018-04-06T20:15:39.813 回答
0

我有这个输入,每行顶部都有空格:

 1. http://lynx.invisible-island.net/
 2. http://lynx.invisible-island.net/lynx.html

然后,抑制第 1 到 3 行:

lynx --dump -listonly http://lynx.invisible-island.net/ | sed -E 's/^ ?+[0-9]+\. //; 1,3d'

输出

http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
于 2018-04-07T00:47:45.633 回答