我正在使用一个应用程序来搜索这个我现在无法控制的网站,并且想知道是否有一种方法可以只使用正则表达式来忽略重复匹配。
现在我写这个来获取页面源代码中图像源的匹配
使用它来检索 src
<span> <img id="imgProduct.*? src="/(.*?)" alt="
由此
<span> <img id="imgProduct_1" class="SmPrdImg selected"
onclick="(some javascript);" src="the_src_I_want1.jpg" alt="woohee"> </span>
<span> <img id="imgProduct_2" class="SmPrdImg selected"
onclick="(some javascript);" src="the_src_I_want2.jpg" alt="woohee"> </span>
<span> <img id="imgProduct_3" class="SmPrdImg selected"
onclick="(some javascript);" src="the_src_I_want3.jpg" alt="woohee"> </span>
唯一的问题是,上面列出的完全相同的代码在源代码中重复得更低。有没有办法只使用正则表达式来忽略或删除重复项?