Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我目前正在通过 HTML 页面搜索特定链接,目前我有一个如下的正则表达式来获取通用 URI:
Regex regex = new Regex(@"(https?|ftp|file)\://[A-Za-z0-9\.\-]+(/[A-Za-z0-9\?\&\=;\+!'\(\)\*\-\._~%]*)*");
虽然 HTML 中有几个链接,所以它选择了第一个,因为我要提取的链接如下:
http://*.*.com/dlp/*/*/*
使用正则表达式如何实现这一点?
试试这个:
http\://[A-Za-z0-9\.\-]+\.com/dlp[A-Za-z0-9\.\-/]*
您可能需要再次转义一些字符。