我已经制作了运行以获取页面 html 的应用程序,当我得到它时,我必须根据不同的模式将 url 标记为可用或不可用。这些模式在 txt 文件中提供:
例子:
+apple+banana+”baby cart” –blog
+”apple skin” +banana +”baby cart” –blog
+”apple skin” +”buy now” +jpg
这"
是说短语而不是单词。
- html 必须包含苹果、香蕉和婴儿车,并且不能包含博客
- html 必须包含苹果皮和香蕉和婴儿车,并且不能包含博客
- html 必须包含苹果皮和立即购买和 jpg
问题
在这种情况下我可以使用正则表达式吗?如果是,则上述模式的正则表达式等价物是什么,所以我们可以在 txt 文件中使用它们,除了这些之外,只需将其用作在 HTML 中匹配的模式......
(这些模式不区分大小写)。