我正在将数据从 1 个数据库导入到另一个数据库。我被要求删除所有 HTML 内容,因为它杂乱且无效,只保留链接
我目前使用以下 VB.NET 函数从内容字符串中删除所有 HTML 标记:
Public Shared Function StripHTML(ByVal htmlString As String) As String
Dim pattern As String = "<(.|\n)*?>"
Return Regex.Replace(htmlString, pattern, String.Empty)
End Function
我正在寻找一种a
从内容中剥离所有但(锚)标签的方法。
例如,如果我有以下 HTML 内容:
<table>
<tr>
<td>
Lorem <a href="http://google.com">Ipsum</a>
</td>
</tr>
</table>
这将简单地变成:
Lorem <a href="http://google.com">Ipsum</a>
我怎样才能做到这一点?