我需要从一段文本中提取一个包含 url 中特定单词的超链接。例子;
“这是一个带有指向某个页面的链接的文本。单击此链接<a href="/server/specificword.htm>this is a link to a page</a>
可查看该页面。这是一个没有“特定词”一词的链接:<a href="/server/mypage.htm>this is a link without the word "specificword" in the url</a>
“
所以,我需要解析这段文字,检查超链接,看看其中一个是否包含“特定词”这个词,然后提取整个超链接。然后我会得到这个:
<a href="/server/specificword.htm>this is a link to a page</a>
我需要在 URL 中包含特定字词的超链接,例如。/server/specificword.htm,不在链接文本中
我试过的一个正则表达式是这个:/(<a[^>]*>.*?</a>)|specificword/
这将匹配文本中的所有超链接,或“特定词”。如果文本有多个链接,没有“特定词”这个词,我也会得到这些。
另外,我试过这个,但它什么都没有:
<a.*?href\s*=\s*["\']([^"\'>]*specificword[^"\'>]*)["\'][^>]*>.*?<\/a>
我的正则表达式技能到此结束,任何帮助都会很棒......