使用正则表达式,我正在努力弄清楚如何匹配 HTML 文档中的图像源模式,并将其替换为不同的路径:
像这样替换源:
img alt="description" align=left src="/xxxx/ssss/sssss/sssss/Photos/myimage.jpg"
像这样:
img alt="description" align=left src="http://www.mysite.com/subsite/images/myimage.jpg"
保持相同的图像名称。
你可以试试这个:
/<img\s+([^s]\w+=\"[^"]+\"\s+)*src=\"([^"]+)\"\s+(\w+=\"[^"]+\"\s+)*\/>/i
并且图像 src 将保存在 \2 中,其中 \w 表示任何单词字符(字母、数字、下划线),而 \s 表示任何空格字符。这个正则表达式将匹配 src 即使它不是第三个属性。
您可以在 rubular.com 上尝试一下,看看它是如何工作的。
搜索模式:
img alt="description" align=left src="\K[^"]*(?=")
将匹配替换为以下值:
http://www.mysite.com/subsite/images/myimage.jpg
(抱歉,不懂 C#。)