16

我们目前正在制作一份报纸的 pdf 版本,我们有一个 .net 网站,该网站捕获要发布的文章,将输入的内容存储为 html,因此我们可以保持粗体、下划线、删除线等样式。

一旦将其存储在数据库中,我们计划使用 Indesign 创建 pdf。我们目前已经构建了一个模板,但是当我们生成一个 xml 文档并导入到 Indesign 中时,html 标签就被写出来了。有没有办法解决这个问题,让 Indesign 像在 html 中一样维护标签?我们只需要一些简单的,比如粗体、三振、下划线、居中对齐。

谢谢。

4

7 回答 7

6

Pandoc现在支持导出到 ICML(可以“放置”在 InDesign 文档中的 Adob​​e InCopy 的 XML 格式)。要将 HTML 转换为 ICML:

pandoc --standalone -o output.icml input.html

有关工作流程的详细信息,请参阅pandoc wiki 中的在 InDesign 中导入 Markdown 。

于 2014-07-10T20:25:28.670 回答
5

您需要将 HTML 标记转换为 CharacterStyles,并在导入时将其应用于 XML。

棘手的是 CharacterStyles 不能像 HTML 那样嵌套应用,因此您需要为可能存在的每个组合创建一个 CharacterStyle。或者,您可以使用脚本将样式应用于特定的文本运行。

于 2012-03-18T16:38:18.727 回答
1

Adobe 产品对于通用标准 (!) 导入是“封闭的”,例如导入XHTML

如何抗议 Adob​​e?!

当我们有很多文件时,就会出现最大的问题......


通过批处理的一种解决方案(很多文章)

...我今天(2013 年)可以使用的唯一方法是这个(半自动)程序:

  1. [手册,准备]检查我的InDesign“模板”文件,该文件将用作“导入器”:必须定义具有清晰名称的样式。PS:它们在 HTML+CSS 导出中都是可见的(列出)。
  2. [手册,准备]调整我的 (X)HTML 文件以使用 CSS名表达所有相关样式(不是通过样式属性,也不是通过奇怪的类名);
  3. [自动,批处理]使用Python OpenDocument Converter自动我所有的 (X)HTML 文件转换为 DOC 。
  4. [ InDesign 辅助的最终处理]从 InDesign 的“模板”(第 1 项)文件克隆导入每个 DOC 。InDesign 样式将自动转换(第 2 项)。

此过程优于 IDML,因为直接使用 XHTML 作为 InDesign 的内容源。它并不适合所有应用程序,但避免使用 IDML 的非标准转换避免学习 IDML,避免 IDML 限制,避免 IDML 错误的风险......所以,我认为比尝试和尝试 IDML 程序更快。


另一个过程 -更好,因为它允许表达脚注之类的东西 - 是通过将 XML 转换为DOCXRFT的 XSLT 准备从 XML 到 MS-Word 的直接转换......你有这种链接或线索吗?程序?

于 2013-05-08T12:22:45.270 回答
1

我们有一些直接将 xml 导入 InDesign 的糟糕经历。

如果您仍然遇到此问题,请查看开源 Ickmull 代码库。它将 xhtml 文件转换为 idml 文件,然后可以在 InDesign 中打开该文件。这可能是为您提供更好的网络打印工作流程。

http://code.google.com/p/ickmull/

于 2012-05-12T04:02:20.527 回答
1

也许您可以使用 Markdown 到 InDesign 翻译器作为起点: http ://www.jongware.com/markdownid.html

于 2012-11-06T23:07:53.113 回答
1

这个工具是 InDesign 导入器的一个不错的 HTML: https ://www.id-extras.com/html-import-script

这可能需要一些返工,但它带来了可以编辑的样式,并为我节省了大量时间。

于 2018-05-29T15:27:09.293 回答
0

这是一个古老的问题,但这个问题可能是长期存在的。

这是一个简单的现实世界技术。它可能不完全适合自动工作流程,但非常适合偶尔使用。

  1. 复制 html 代码,例如从浏览器的源代码视图中。省略头部、css、菜单等,只复制可能包含在一系列div、section或其他容器标签中的相关内容。

  2. 粘贴到文本文档(Windows 上的记事本,Mac 上的 TextEdit)并保存为带有.html扩展名的纯文本文件。

  3. 使用 LibreOffice 打开 html 文件。我尝试使用版本 4 和 6,它们都可以很好地解析 html。您将获得包含段落样式(如标题)和字符样式(如粗体和斜体)的文档。(可选)全选并将字体更改为 Times New Roman。另存为.docx文件或其他文件类型。

  4. 将其导入 InDesign,并带有用于保留样式和格式化以及自动导入样式的选项。您将获得一个包含段落样式和字符样式的文档,您可以根据需要对其进行编辑。

于 2020-05-18T17:07:34.243 回答