所以我在提取数据方面取得了巨大的成功,只要我匹配的内容不超过 1 行,如果它超过 1 行,我就会感到胃灼热(似乎)......这是 HTML 数据的片段我得到:
<tr>
<td width=20%>3 month
<td width=1% class=bar>
<td width=1% nowrap class="value chg">+10.03%
<td width=54% class=bar>
<table width=100% cellpadding=0 cellspacing=0 class=barChart>
<tr>
我对“+10.03%”的数字感兴趣,并且
<td width=20%>3 month
是让我知道“+10.03%”是我想要的模式。
所以到目前为止我在 Python 中已经有了这个:
percent = re.search('<td width=20%>3 month\r\n<td width=1% class=bar>\r\n \r\n<td width=1% nowrap class="value chg">(.*?)', content)
其中变量内容包含我正在搜索的所有 html 代码。这似乎对我不起作用......任何建议将不胜感激!我读过其他几篇关于 re.compile() 和 re.multiline() 的帖子,但我对它们没有任何运气,主要是因为我不明白它们是如何工作的……