我正在使用这个正则表达式来过滤网页中的 .pdffiles:
$regex='|<a.*?href="(.*pdf?)"|';
如果链接是这样的,它就可以完成工作:
www.xyz.com/trgrrtr/ghtty.pdf
但如果链接是这样的,则无法过滤:
www.xyz.com/trgrrtr/ghtty.pdf?code=KksRHhdVXAoECBFCVFpeXBsBUgYMDQpxd3J2d3F2fDtzfnFuLiErNXNpIG5kYm16aGhpcmxoa05QV1VKUVFFUxQ%3D
我应该使用什么正则表达式从网页中过滤掉这个链接?