我有一个带有一些自闭合标签的 html 文件,但 BeautifulSoup 不喜欢它们。
from bs4 import BeautifulSoup
html = '<head><meta content="text/html" http-equiv="Content-Type"><meta charset="utf-8"></head>'
doc = BeautifulSoup(html, 'html.parser')
print doc.prettify()
印刷
<head>
<meta content="text/html" http-equiv="Content-Type">
<meta charset="utf-8"/>
</meta>
</head>
我必须手动检查每个标签是否自动关闭并进行适当修改,还是有更好的处理方法?