我想从 HTML 页面(实际上是 tinymce 用户输入)中删除所有不符合特定标准(class = "int" 或 class = "ext")的图像,并且我正在努力使用正确的方法。这就是我目前正在做的事情:
hbody = Hpricot(input)
@internal_images = hbody.search("//img[@class='int']")
@external_images = hbody.search("//img[@class='ext']")
但我不知道如何找到类具有错误值的图像(不是“int”或“ext”)。
我还必须遍历元素以检查不是标准 html 的其他属性(我使用它们来设置内部值,例如我在属性 dbsrc 中设置的 DB id)。我也可以访问这些属性吗?有没有办法在某些元素(在 hpricot 搜索结果中)不符合我的条件时删除它们?
谢谢你的帮助!