我有一个存储在字符串中的 HTML 表
string tbl = "<table calls='report'><tr><th>head</th><th>name</th></tr><tr><td>Department name</td><td>Mike</th></tr></table>";
我怎样才能遍历这个字符串,然后将其写入 XML 文件?
我想我将能够将文件写入 XML,但问题是如何或循环遍历字符串并识别 t 中的内容以及如何解析它。
谢谢
我有一个存储在字符串中的 HTML 表
string tbl = "<table calls='report'><tr><th>head</th><th>name</th></tr><tr><td>Department name</td><td>Mike</th></tr></table>";
我怎样才能遍历这个字符串,然后将其写入 XML 文件?
我想我将能够将文件写入 XML,但问题是如何或循环遍历字符串并识别 t 中的内容以及如何解析它。
谢谢
由于 HTML 已经是 XML,您可以保持原样并满足您的目标。但我假设您想要语义上有意义的标签名称。
你可以试试HTML Agility Pack。这允许您编写针对对象模型的查询,类似于使用 XDocument 和 Linq-to-XML 执行此操作的方式。我引用:
这是一个敏捷的 HTML 解析器,它构建一个读/写 DOM 并支持普通的 XPATH 或 XSLT(实际上你不必了解 XPATH 或 XSLT 就可以使用它,不用担心......)。它是一个 .NET 代码库,允许您解析“网络之外”的 HTML 文件。解析器对“真实世界”格式错误的 HTML 非常宽容。对象模型与 System.Xml 的提议非常相似,但用于 HTML 文档(或流)。
如果您不熟悉 XPATH 等,它还支持 Linq。