我正在使用 lxml.html.clean 来清理 html。它似乎从所有标签中删除了“样式”属性,出于我的目的,我需要不删除样式属性。
在我开始允许之前,我很想了解在清理 html 时不删除样式属性是否存在任何安全隐患。
专家们对此事的任何见解都将受到高度赞赏。
(请注意,我的应用程序允许最终用户创建保存在后端数据库中的 html,然后在页面上呈现。上面的“干净”可以很好地在保存之前从 html 中删除任何恶意 html(例如 javascript 等)后续渲染)。
每个feedparser HTML 清理网站- 'style' 不在'safe_attrs' 列表中
(另外,如果这是一个行人问题,我很抱歉。我是 html/sanitization 和相关安全方面的新手)