-1

我正在一个网站上工作,我将大量文本上传到每个页面。现在,我在 Google Drive 中编写文本本身,使用粗体、斜体、缩进、行距……保持故事可读性的常用格式。

但我不确定我应该如何从文本中生成 HTML。我的意思是,显然有很多方法。Google Drive 本身允许我下载 HTML 代码。我可以在 OpenOffice 中复制文本并另存为 HTML。而且我发现了几个带有在线转换器的网站。

但我尝试的每一种方法似乎都有缺陷。充其量,它会为每个段落生成非常不雅的代码堆,其中大部分是不必要的。在最坏的情况下,它会丢失所有格式,给我留下纯文本。

另外,我想知道我是否应该使用 CSS 样式表,这样如果我对样式进行更改,我就不需要为每个 HTML 页面重复它们……但我不确定这些与 HTML 代码交互的效果如何我会按原样生成。

那么,有什么推荐的将文本转换为干净 HTML 的方法吗?

4

2 回答 2

1

我最喜欢的去除 Google Docs 放入的所有不必要的 HTML 垃圾的方法是抓取 HTML 文件,并使用pandoc将 HTML 转换为 Markdown,然后再转换回 HTML。

但是,它不包括任何缩进或行距特征。正如你所说,这些应该用 CSS 来完成。HTML >> Markdown >> HTML 转换将去除所有class属性,因此您可以<p>使用 CSS 为您的标签设置样式,就像您为当前页面设置样式一样。

对我来说,这为将使用 Word 或 Google Docs 创建的文档转换为 HTML 提供了一个非常好的(且免费的)起点。当然,您仍然需要手动编辑 HTML,但在我看来,添加HTML 远比删除它更令人沮丧。

于 2013-09-04T23:41:52.243 回答
0

我曾经使用过Dreamweaver CS,效果非常好。如果您从 Word 中粘贴文本,将尊重粗体、斜体等...并且 html 输出非常干净。希望能帮助到你。

于 2013-09-04T23:35:11.510 回答