我正在处理的一个项目是使用非常旧的(2.1-gr12)版本的HtmlCleaner从 HTML 文件中获取信息。我们发现 HtmlCleaner 不解码字符引用,例如&
,在 HTML 元素文本内容和 HTML 属性值中都没有!例如,test
属性<span test="foo&bar">stuff & more stuff</span>
将被解释为foo&bar
,内容将被解释为stuff & more stuff
。
HtmlCleaner 不支持字符引用吗?这是在以后的版本中添加的,还是我们需要设置一些设置?