我有一个明显简单的管道正则表达式查询 - 我需要从它的 ( <img>
) 标记开始截断每个项目。我认为<img[.]*
用空白字段替换字符串正则表达式的循环会处理它,但无济于事。
显然我在这里遗漏了一些基本的东西——有人能指出来吗?
该项目目前的情况如下:
sample text title
<a rel="nofollow" target="_blank" href="http://example.com"><img border="0" src="http://example.com/image.png" alt="Yes" width="20" height="23"/></a>
<a.... (a bunch of irrelevant hyperlinks I don't need)...
基本上我只想要标题文本和超链接,这就是为什么我要砍掉其余部分
做得更好,因为我在这里真正要做的就是通过在进一步操作之前将其削减来使项目字符串更易于管理 - 任何人都知道是否可以从页面中的某个链接中提取一个 href(在这种情况下是第一个)在 Yahoo Pipes 中使用正则表达式?我已经看到了这个 SO q的正则表达式答案,但我不确定如何使用它将 URL 映射到 Pipes 模块中的项目属性?