0

我实际上有一个带有 html 的字符串。我想使用 xmlparser 解析它。pb 是我的字符串的某些标签不正确。特别是<img />标签。所以我需要替换那些标签,因为它错过了最后的/. 我想检索所有img标签并/在最后添加一个。为此,我需要找到<img我的文本中的所有内容,直到下一个>替换它/>以解析我的字符串。

任何人都可以帮助我吗?

谢谢

4

1 回答 1

3

你在自找各种麻烦。尝试一个更适合该任务的库。看起来BeautifulSoup可能是你想要的。

如果你对 using 死心塌地xmlparser,那么你可能想先用 useBeautifulSoup来清理 HTML。请参阅: 如何修复错误嵌套/未闭合的 HTML 标记?

于 2012-05-23T18:40:37.040 回答