我有一个Metro 应用程序,可以从各种来源格式化 html,因此 html 结构没有任何一致性。幸运的是,有一个用于Metro AppsHtmlAgilityPack
的构建可以帮助解决这个问题。
我正在努力确保一切都HTML
符合这个标准:
<html>
<head>
...
</head>
<body>
...
</body>
</html>
你为什么问?我想使用CSS3
需要我的过渡/动画
- 中添加一些样式
HEAD
。 - 订阅
BODY
onload
活动。
我对源 html 的问题是:
- 有时包含一个
HTML
标签。 - 有时包含一个
HEAD
标签。 - 有时包含一个
BODY
标签。
这是我到目前为止所拥有的:
// Load the html
HtmlDocument htmlDocument = new HtmlDocument();
htmlDocument.OptionFixNestedTags = true;
htmlDocument.LoadHtml(html);
// Ensure that the html node exists
HtmlNode htmlNode = htmlDocument.DocumentNode.Element("html");
if (htmlNode == null)
{
htmlNode = HtmlNode.CreateNode("html");
htmlDocument.DocumentNode.AppendChild(htmlNode);
}
// Ensure that the head node exists
HtmlNode headNode = htmlNode.Element("head");
if (headNode == null)
{
headNode = HtmlNode.CreateNode("head");
htmlNode.AppendChild(htmlNode);
}
// Ensure that the body node exists
HtmlNode bodyNode = htmlNode.Element("body");
if (bodyNode == null)
{
bodyNode = HtmlNode.CreateNode("body");
htmlNode.AppendChild(bodyNode);
}
这就是我坚持的:
- 现在一些结构已经到位,我如何找到并移动所有不应该在 HTML 或 HEAD 标签中的标签并将它们移动到 BODY 标签中。
这是一个格式错误的 html 示例:
<a href="http://www.somewhere.co.za/" target="_blank"> Somewhere (Pty) Ltd</a><br><br>
Hello Anonymous!, <br>
Good news! You order has been shipped. <br>
Order Number: 108<br>
Order Details: <a href="http://somewhere.co.za/orderdetails/108" target="_blank">http://somewhere.co.za/orderdetails/108</a><br>
Date Ordered: 14 June 2013<br><br><br><br>
<table border="0" style="width:100%;">
<tr style="background-color:#b9babe;text-align:center;">
<th>Name</th>
<th>Quantity</th>
</tr>
<tr style="background-color: #ebecee;text-align: center;">
<td style="padding: 0.6em 0.4em;text-align: left;">Non Branded - Ladies - Batwing Sleeves High Elastic Loose (Non Branded - Ladies - Batwing Sleeves High Elastic Loose - Grey)
<br>
Size: Free Size
<br>
SKU: NBLBSHELGY
</td>
<td style="padding: 0.6em 0.4em;text-align: center;">1</td>
</tr>
</table>
解决方案不应专门针对上述 html 进行编码。我只是用示例 html 演示它没有 html、head 或 body 标记。