0

我想解析我的网站,搜索<iframe>-Tag 并获取 URL (attr src="")。

我试过这样:

url=`wget -O - http://my-url.com/site 2>&1 | grep iframe`
echo $url

有了这个,我得到了整个 HTML 行:

<iframe src="//player.vimeo.com/video/AAAAAAAA?title=0&amp;byline=0&amp;portrait=0" width="480" height="360" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>     </div>

那么,我现在如何解析 URL?我尝试了一些sed-syntaxes,但没有成功:(这是我尝试过的:

wget -O - http://myurl.com/ 2>&1 | grep iframe | sed "s/<iframe src/\\n<iframe src/g"

亲切的问候,马特;)

4

2 回答 2

2
sed -n '/<iframe/s/^.*<iframe src="\([^"]*\)".*/\1/p'

你不需要grepsed模式匹配就可以做到。然后,您使用捕获组\(...\)来挑选src属性中引号内的 URL。

于 2014-12-11T14:07:20.033 回答
0

你不需要 sed,cut 就足够了:

~$ url='<iframe src="//player.vimeo.com/video/AAAAAAAA?title=0&amp;byline=0&amp;portrait=0" width="480" height="360" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>     </div>'
~$ echo $url|cut -d'"' -f 2
//player.vimeo.com/video/AAAAAAAA?title=0&amp;byline=0&amp;portrait=0
于 2014-12-11T13:42:58.550 回答