我在 Python 中使用正则表达式来搜索页面源,并在 javascript 中找到所有 json 信息。具体来说,一个示例如下所示:
变量 fooData = {
编号:123456789,
名称:“富吧”,
国家名称:“富”,
country_is_eu:空,
foo_bars:空,
foo_email:空,
foo_rate: 1.0,
foo_id: 0987654321
};
我对了解有关正则表达式的所有知识还很陌生,而且我不确定我所做的是否正确。我可以得到一些单独的线路,但我不完全确定如何使用 re.MULTILINE。这是我现在拥有的代码:
prog = re.compile('[var ]?\w+ ?= ?{[^.*]+\n};', re.MULTILINE)
vars = prog.findall(text)
为什么这不起作用?
更清楚地说,我真的需要它来匹配这些括号之间的所有内容,如下所示:
变量 fooData = {
};
所以,基本上我无法找到一种方法来匹配每一行,除了如下所示:
};