0

我有一个包含 3 列的 CSV 文件:站点 ID、HTML 标头、HTML 页脚

我需要浏览 HTML Header 和 Footer 列并找到任何版本的 Google Analytics 跟踪代码,然后将其删除,但保留这些单元格中的任何其他内容。

我尝试使用这个正则表达式:<script(?m:.*?)\'UA-.{8,12}\'(?m:.*?)</script>但它似乎被抛弃并删除了太多,可能来自 CSV 中某处的一些格式错误的代码。

关于更好的方法来做到这一点的任何想法?

4

1 回答 1

1

对于快速的一次性替换,您可以通过避免不贪婪的重复并从重复中的允许序列中排除<script或排除来修复它。</script将两者都替换.*?

(?:(?!</?script).)*
于 2013-08-27T21:13:50.137 回答