我正在使用 Beautiful Soup 4 来刮一页。有一段我不想要的文字:
<p class="MsoNormal" style="text-align: center"><b>
<span lang="EN-US" style="font-family: Arial; color: blue">
<font size="4">1 </font></span>
<span lang="AR-SA" dir="RTL" style="font-family: Arial; color: blue">
<font size="4">ـ</font></span><span lang="EN-US" style="font-family: Arial; color: blue"><font size="4">
сүрә фатиһә</font></span></b></p>
它的独特之处在于它有一个标签。我已经使用 findall() 来获取所有
标签。所以现在我有一个 for 循环,如:
for el in doc.findall('p'):
if el.hasChildTag('b'):
break;
不幸的是 bs4 没有“hasChildTag”功能