我有一个产品数据库及其描述。我需要为翻译服务导出描述/产品名称。问题是描述以 html 格式存储在数据库中。
当我将数据导出到 excel 时,单元格中也包含所有 html 语法。
有什么办法可以删除语法吗?我在想可能在导出时不一定在 excel 中。
我也可以将所有单元格数据复制到一个常规的 html 文件中,然后在我的浏览器中打开它并复制粘贴,但这不会保留单元格结构。
有任何想法吗?
如果可以将其保存为 html 文件,则应该可以使用 Excel 的内置功能。在 Excel 2007 及更高版本中,转到数据选项卡,然后选择“来自 Web”。
在出现的浏览器窗口中,将其指向 html 文件 C:\yourfile.html
它应该打开具有所有格式等的文件,并且如果数据是表格格式,您应该可以单击黄色框将其导入。
在 TSQL 中去除 HTML
http://cosier.wordpress.com/2008/10/22/tsql-strip-html-function/
这可能对您有用(添加对“Microsoft HTML 对象库”的引用)
Function HtmlToText(html As String) As String
Static el As New MSHTML.HTMLDocument
Static div As Object
If div Is Nothing Then
Set el = New MSHTML.HTMLDocument
Set div = el.createElement("div")
el.appendChild div
Debug.Print "created"
End If
div.innerHTML = html
HtmlToText = div.innerText
End Function