我正在获取带有一堆 javascript 的网页,并且我有兴趣通过页面的 javascript 部分解析某些相关信息。现在我在 Python/BeautifulSoup/regex 中有以下代码:
scriptResults = soup('script',{'type' : 'text/javascript'})
这会产生一个脚本数组,我可以使用 for 循环来搜索我想要的文本:
for script in scriptResults:
for block in script:
if *patterniwant* in block:
**extract pattern from line using regex**
(当然,星号中的文本是伪代码。)
我想知道是否有更好的方法让我只使用正则表达式来查找汤本身的模式,只搜索脚本本身?我的实现工作,但它看起来真的很笨重,所以我想要更优雅和/或高效和/或 Pythonic 的东西。
提前致谢!