我刚试过...
lynx -dump -list_inline "http://www.samplepage.com"
获取网页的格式化输出。但是,我注意到对于链接,只标记了起点,而没有标记终点。例如,对于这样的事情
this is <a href="www.link.com">a link</a> somewhere
我明白了
this is [www.link.com]a link somewhere
但我想得到的是
this is [www.link.com]a link[endlink] somewhere
这样我就知道链接中确切包含了文本的哪一部分。有谁知道如何做到这一点?
非常感谢您的帮助!
最好的问候,弗洛里安