3

文档列出了默认允许/删除的标签:

http://www.feedparser.org/docs/html-sanitization.html

但它没有说明如何指定要删除的附加标签。

有没有办法使用 Universal Feed Parser 来做到这一点,或者您是否必须使用您自己的正则表达式和/或 Beautiful Soup 之类的东西进行进一步处理?

4

1 回答 1

6

我快速浏览了代码,我认为没有办法直接覆盖它们。但是你可以覆盖feedparser._HTMLSanitizer.acceptable_elements在做之前不会被删除的标签列表feedparser.parse

于 2009-05-02T21:34:41.037 回答