我正在解析一个包含几个脚本块的 HTML 页面:
<script type="text/javascript">
// some code
</script>
<script type="text/javascript">
foo(arg1, arg2);
// some code
</script>
我需要提取foo函数的参数 - 'arg1' 和 'arg2'。目前我可以获取脚本标签的内部内容:
def parse_foo(pageContent):
soup = BeautifulSoup(pageContent)
scriptTags = soup.find_all('script')
for script in scriptTags:
tagContent = script.get_text()
if tagContent.count('foo') > 0:
return tagContent
return ''
有什么方法可以使用 BeautifulSoup 获取参数,还是应该使用正则表达式?