我有一个文本块(单行),它是由标签和一堆其他垃圾分隔的 URL 列表。我想解析与“http.*">RSS”匹配的 URL 的整个块,编辑该模式的所有实例(以删除 glob 之后的所有内容),并将整个内容作为 line- 输出到文件中分开的条目。
我想我可以用 GREP 做到这一点(然后用 SED 编辑和添加新行),但是 GREP 抓取匹配的行,而不是匹配的模式。我应该使用不同的命令吗?我还尝试使用 SED 在模式之前添加一个换行符 (\n),无论它发生在哪里,但这也不起作用。
编辑:这是我正在使用的数据的示例:
OUT</a> (<a href="https://evilcakes.wordpress.com/rss">RSS</a>)</li><li><a href="http://eater.com/" title="">Eater National</a> (<a href="http://feeds.feedburner.com/EaterNational">RSS</a>)</li><li><a href="http://www.foodtechconnect.com" title="">Food+Tech Connect</a> (<a href="http://feeds.feedburner.com/foodtechconnect">RSS</a>)</li><li><a href="http://www.innatthecrossroads.com" title="">Inn at the Crossroads</a> (<a href="http://innatthecrossroads.com/feed/">RSS</a>)</li><li><a href="http://www.seriouseats.com/" title="">Serious Eats</a> (<a href="http://feeds.seriouseats.com/seriouseatsfeaturesvideos">RSS</a>)</li><li><a href="http://www.thatsnerdalicious.com" title="">That's Nerdalicious!</a> (<a href="http://www.thatsnerdalicious.com/feed/">RSS</a>)</li><li><a href="http://thedrunkenmoogle.com/" title="">The Drunken Moogle</a> (<a href="http://www.thedrunkenmoogle.com/rss">RSS</a>)</li></ul></li><li><h2 class="entry-title">Comics</h2><ul class="opmlGroup"><li><a