如何从 HTML 表格代码中删除/剥离所有格式或样式信息?
我需要删除所有颜色、字体大小等。可能完全删除所有style
属性class
。
可能我只想删除一些标签和属性。通过删除标签,我的意思是保留它的内容,但删除开始和结束标签名称。
几年前我在VB6中做了类似的事情。下面复制的是代码。如您所见,代码只是逐个字符地遍历 HTML,并删除了 < 和 > 标记之间(包括)之间的所有内容。希望您可以在使用的任何工具中做类似的事情。
Function CleanTags(HTML As String) As String
Dim result As String, b As Boolean, c As String, i As Long
b = False
For i = 1 To Len(HTML)
c = Mid(HTML, i, 1)
If c = "<" Then b = True
If b = False Then result = result & c
If c = ">" Then b = False
Next i
CleanTags = result
End Function