0

我在文本文档中有一个网页源,有几行如下:

"rid" : 'http://web.site/urlhere',

如何使用 Linux/终端 grep 只是该http://web.site/urlhere部分?

4

1 回答 1

1

您可以将-o选项传递给 grep 以告诉它仅显示匹配的模式。

grep -o http://web.site/urlhere somefile.txt

假设您正在寻找通用 URL,您可以从以下内容开始(并可能对其进行改进):

grep -o "'http.*'" someFile.txt | sed "s/'//g"

这将在单引号后搜索文本http并将包括该行中的所有字符,直到最后一个单引号。然后它将结果(仅匹配模式)传递给 sed 并删除单引号。

注意:如果您在 url 后面有更多单引号,您可能会遇到麻烦(但您的问题没有提及)...

由于您的问题非常不具体,因此可能还有许多其他输入条件可能会导致问题,但以上应该是一个很好的起点。

有关 grep 的更多信息: http ://unixhelp.ed.ac.uk/CGI/man-cgi?grep

于 2012-05-24T01:53:24.660 回答