1

几天前,我收到了一份相当冗长且有些复杂的 MS Word 文档,我被要求将其转换为 HTML 以上传到第三方的网站。我的第一反应是将 Word 文档保存为 HTML 并使用 Dreamweaver 的“清理 Word HTML”命令。但我不仅必须让 Dreamweaver 整夜运行才能完成“清理”,而且我认为结果远非理想。Dreamweaver 完全遗漏了许多剩余的内联样式等。

今天早上我以不同的方式处理它,只是在 Word 中选择了整个文档,复制它,然后将其粘贴到 Dreamweaver 的设计窗口中。不仅速度快了很多,而且输出的代码也干净了很多!我也不必在后面运行“Clean Up Word HTML”命令。

现在,出于标准原因,我从不将 Word 文件直接转换为 HTML。相反,我在 Word 和 Dreamweaver 之间剪切和粘贴内容。很高兴我可以做到以下几点。

  1. 如果 Word 标题采用 Heading 1 样式,它将成为 Dreamweaver 中的 H1(遵循 Dreamweaver 样式表)。类似地,标题 2 变为 H2,标题 3 变为 H3,依此类推。

    如果 Word 作者没有那么有条理,您可以在 Mac 上使用 Control+1(或 Command+1)之类的快捷方式将任何行转换为 H1。你能猜出H2的快捷方式吗?是的,它是 Mac 上的 Control+2 或 Command+2。

  2. 段落现在剪切和粘贴为段落(带有 P 标签)。如果您此时不想要 HTML 段落,则使用 Control+0(或 Mac 上的 Command+0)在 Dreameaver 中将其删除。

  3. 我发现的一个新问题是,当您从 Word 复制和粘贴时,Word 中的一些嵌入图像可能会作为“剪辑”图像传输到您的 Dreamweaver 站点。因此,如果您有一个带有嵌入图像的 Word 文件,则可以通过 Dreamweaver 相当快速地提取它们。

我还发现这个免费工具很有用http://www.textfixer.com/html/convert-word-to-html.php它的工作原理与 Dreamweaver 的设计视图相同,对没有 Dreamweaver 的人很有用。

但是我们将得到什么代码取决于格式正确的 MS Word 文档有多少?

WORD 2007 也有类似 html 的样式?

标题、表格、有序和无序列表、粗体、斜体、超链接等?

如何在语义上使用 word 2007?

  • 在另存为 html 选项时获得最大可能的语义 html

  • 为了在 Dreamweaver 设计视图中复制尽可能多的干净代码?

  • 为了获得尽可能多的干净代码,以放置
    每个 CMS 附带的基于浏览器的 WYSIWYG HTML 编辑器

有谁知道语义格式化 MS WORD 文档的任何提示、技巧、教程、文章或建议?

或者还有什么比我更好的方法?

4

5 回答 5

3
  • HTML Tidy有这方面的选项word-2000bareclean.

  • FCKEditor 和类似的尝试清理从 Word 粘贴的代码。

  • 有(现在相当老了)demoroniser

然而,不要指望奇迹。Word 文档不太可能具有良好的结构(理论上可以,但没有 Word 用户会为此烦恼)。如果语义信息不存在,这些程序就无法添加语义信息。

至于 Word 中的语义编辑——使用样式。它正确支持标题(遗憾的是没有太多其他)。您可以在大纲视图中进行检查。

您不需要——也不应该使用——空格或换行符来进行缩进或空间调整。Word 能够显式控制段落的填充。

于 2009-12-20T22:07:35.120 回答
1

我发现 OpenOffice.org html 生成器(在 OO 中打开 .doc 并另存为 HTML)比 Office 中的 MS 更好。

它仍然不完美,但提供了更清晰的 HTML,看起来更清晰。

于 2010-01-05T20:34:50.380 回答
0

没有可靠的方法来清理 WORD 文档并将它们变成漂亮的 HTML。如果文档有任何特殊字符,它们通常被编码为 Windows 字符集而不是 UTF-8,因此它们在在线显示时只是“中断”。名单还在继续。你经常会以愚蠢而告终,例如:

<strong>hello</strong><strong>th<strong>er</strong>e</strong><i></i>

唯一可删除的方法是将其粘贴到记事本中并手动标记。您可以编写一些宏来执行诸如<p></p>在分段符处插入之类的操作,仅此而已。

如果有大量材料需要从 Word 联机,您最好使用 PDF。

于 2009-12-18T16:29:50.510 回答
0

你试过这个吗?词清洁剂

于 2009-12-19T03:23:57.810 回答
0

试试我们的Doc To HTML Converter软件。它专为生成尽可能清晰的 (X)HTML 代码而设计,并具有许多可定制的选项。它需要在您的系统上安装 MS Word。它不是免费的,但有 30 天的试用期。

于 2013-02-09T14:58:59.930 回答