好的,所以我有一个 RSS 提要。每篇文章都包含多个 HTML 链接。他们都是同一个主机(例如youtube.com),而不是有一个不同的主机。我正在尝试过滤这个链接。
所以目前,我有一个最常见主机(imgur、减号、tumblr 等)的规则列表,如下所示:
(?i).*?href="(https?://[^"]*host1[^"]*).*
(?i).*?href="(https?://[^"]*host2[^"]*).*
(?i).*?href="(https?://[^"]*host3[^"]*).*
问题是:总是有与未知主机的链接。所以我想要做的是,将主机从所有其他链接(都是相同的)“列入黑名单”。我读过(?!regex)
但它似乎不起作用:
(?i).*?href="(https?://[^"]*(?!youtube)[^"]*).*
我希望你能理解我的问题,并为我(可能)糟糕的英语感到抱歉!