3

我在和雅虎开玩笑!管道,我正在用一些正则表达式撞墙。现在我熟悉 Perl 的正则表达式,但 Yahoo! 中的规则似乎有所不同!管道。

我的管道截图

我正在做的是获取一个页面并尝试将其转换为提要,我用于从 HTML 中删除链接的正则表达式工作正常,但我想成为<i>标签中的标题只是输出原始文本.

在 Perl 和此在线正则表达式测试器中匹配的示例文本:

<a rel="nofollow" target="_blank" HREF="http://changed.to/protect/the-guilty.html"><i>“Fee Fi Fo Fun”(英国人)</i>< /a> (另请参阅此其他站点 <a rel="nofollow" target="_blank" href="http://stackoverflow.com">Nada</a>)此处的其他一些文本

4

2 回答 2

6

正则表达式的标题:

(?i).*?<i>([^<]*).*               [ ] g  [x] s  [ ] m  [ ] i

链接的正则表达式:

(?i).*?href="([^"]*).*            [ ] g  [x] s  [ ] m  [ ] i

不知何故,不区分大小写的复选框似乎坏了。幸运的是,您可以替换为(?i),效果很好。

这是一个很好的 web2.0-ish 工具,用于测试正则表达式:RegExr。但由于某种原因,它仍然是测试版。;-)

于 2008-12-11T19:38:50.417 回答
2

使用 YP 需要注意的一件重要事情是不要相信调试屏幕,它有一个小怪癖,即在视图中隐藏一些标签,在尝试正则表达式时可能会导致无休止的混乱。要公开任何隐藏的 html,请将 '<' 替换为 '#'

于 2011-08-07T17:00:19.657 回答