1

我收到了一个最初使用 Word 生成的 HTML 文档。生成的 HTML 可能需要进行一些清理,而且很长,因此手工操作会很乏味。将来我还需要对来自同一来源的其他 HTML 文档执行此操作,因此拥有一个简单的解决方案将在这个单一实例之外有所帮助。

问题之一是未引用的 HTML 属性。我想避免手动添加所有引号,并且正在寻找一种简单的方法来做到这一点。

这是显示文件片段的屏幕截图: 在此处输入图像描述

屏幕截图来自 Visual Studio 2010。V​​isual Studio 识别出存在验证错误并建议添加引号,但我找不到自动添加引号的工具。Visual Studio 中是否有一个选项可以处理添加引号?

我最初是来专门询问有关在 Visual Studio 中执行此操作的问题,但我真的只是在寻找一个好的解决方案。我没有被困在 Visual Studio 中,所以如果有任何其他建议,他们将不胜感激。

4

2 回答 2

1

我已经用HTMLTrim软件做到了这一点。我必须纠正的唯一一点是使用text editor<o:p></o:p>从所有文档中删除标签,因为它抱怨它们。它不会将单引号替换为双引号,但我使用相同的文本编辑器完成了它。如果您之后需要在 word 中打开此文档 - 您将需要删除标题。<?xml ...?>

于 2014-04-28T11:05:19.390 回答
1

看看这个tidyfornet,它是 HTML Tidy 的 .Net 包装器,它是一个 Java 包,可以从标签汤生成有效的 HTML/XHTML。

于 2013-06-20T16:41:07.317 回答