我正在尝试从通过 CFHTTP 请求收到的 HTML 内容中提取 javascript 代码。
只要标签之间的代码中没有换行符,我就有这个简单的正则表达式可以捕获所有内容。
var result=REMatch("<script[^>]*>(.*?)</script>",html);
这将捕获:
<script>testtesttest</script<
但不是
<script>
testtest
</script>
我曾尝试将 (?m) 用于多行,但它不是那样工作的。我正在使用参考来解决它,但我只是没有用正则表达式得到它。
注意,脚本标签之间通常会有 javascript,而不是简单的文本,还有像 {}();:-_ 等字符。
谁能帮我吗?
干杯
[[更新]]谢谢大家,我会尝试解决方案。我喜欢正则表达式,因为但我也会研究 HTML Parser。