我很抱歉标题,我不知道如何正确地问这个问题。
我想使用 python2.7 的re
库来解析一个 HTML 文件。我知道我应该使用 BeautifulSoup 或类似的东西进行解析,但这并不重要。
这个 HTML 文件中有一个部分:<br>(40%)</TD>
. 在此示例中,数字(此处为40
)不时更改。
我想用这个数字作为变量。为了做到这一点,我习惯于将re.split()
之前的40
所有内容和之后的所有内容分开40
:
html = getHtmlTextFromWebsite()
very_important_number = int(re.split("%\)</TD>", (re.split("<br>\(", html))[1])[0])
我发现这是一种非常麻烦的方法,我想知道是否有更好的方法。