terminal - URL 的 Grep 页面源

Question

我在文本文档中有一个网页源，有几行如下：

"rid" : 'http://web.site/urlhere',

如何使用 Linux/终端 grep 只是该http://web.site/urlhere部分？

score 1 · Accepted Answer

您可以将-o选项传递给 grep 以告诉它仅显示匹配的模式。

grep -o http://web.site/urlhere somefile.txt

假设您正在寻找通用 URL，您可以从以下内容开始（并可能对其进行改进）：

grep -o "'http.*'" someFile.txt | sed "s/'//g"

这将在单引号后搜索文本http并将包括该行中的所有字符，直到最后一个单引号。然后它将结果（仅匹配模式）传递给 sed 并删除单引号。

注意：如果您在 url 后面有更多单引号，您可能会遇到麻烦（但您的问题没有提及）...

由于您的问题非常不具体，因此可能还有许多其他输入条件可能会导致问题，但以上应该是一个很好的起点。

1 回答 1