我实际上有一个带有 html 的字符串。我想使用 xmlparser 解析它。pb 是我的字符串的某些标签不正确。特别是<img />
标签。所以我需要替换那些标签,因为它错过了最后的/
. 我想检索所有img
标签并/
在最后添加一个。为此,我需要找到<img
我的文本中的所有内容,直到下一个>
替换它/>
以解析我的字符串。
任何人都可以帮助我吗?
谢谢
你在自找各种麻烦。尝试一个更适合该任务的库。看起来BeautifulSoup
可能是你想要的。
如果你对 using 死心塌地xmlparser
,那么你可能想先用 useBeautifulSoup
来清理 HTML。请参阅: 如何修复错误嵌套/未闭合的 HTML 标记?