所以我需要从一些 HTML 中提取一些脑力激荡的代码,而到目前为止我一直在做的事情是行不通的。HTML 看起来像这样
<div class="style7" style="text-align: justify; overflow: auto;">
<br />++++++++++[>++++++++++++>+++++++++++>++++++++++++>+++++++++++>++++++++++>++++++++++++>++++++++++>++++++++++>+++++++++++>+++++++++++>++++++++++>++++++++++++<<<<<<<<<<<<-]>-----.>++++.>---.>-.>+++.>+.>+++.>++.>+.>---.>-.>-----.<br /><br /><br />
</div>
我正在使用 Python 和 BeautifulSoup。我可以从整个文档中很好地抓住 div,但我似乎无法从
标签之间获得全部的大脑。
我该怎么做呢?谢谢
编辑:
在查看 BeautifulSoup 加载的内容后,它似乎实际上删除了一大块代码。请求内容包含所有内容,但汤没有。
除了 BeautifulSoup,还有更好的解析方法吗?也许是原始 HTML 上的正则表达式?