问题标签 [pandoc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
894 浏览

python - 在 LaTeX 中将 HTML img 标签转换为带有标题的图形

我正在编写一个 python 脚本来解析 Wordpress Export XML (wp xml) 的内容以生成 LaTex 文档。到目前为止, wp xml 被解析lxml.etree,代码生成一个新的 xml 树,由texml处理,然后生成 tex 文件。

目前,我提取每个帖子以及某些元数据(标题、发布日期、标签、内容)。元数据没有问题,但内容部分有点问题。在 wp xml 中,内容作为 CDATA 结构包含在纯 HTML/Wordpress 标记中。要将其转换为乳胶,我选择pandoc来解析内容。TeXml 支持内联 LaTeX,因此内容作为纯 LaTeX 添加到树中。

我决定在这种情况下使用 pandoc,因为它已经很好地转换了大多数 html 标签(a, strong, em...),我唯一的问题是它如何处理图像。

我使用子进程与 pandoc 交互:

示例帖子可能如下所示

我需要带有嵌入标题的图像,例如

pandoc 似乎将 htmlimg标签转换为简单的内联图像,丢弃任何标题或替代文本。

我确实窥视了源代码,它看起来img只被视为内联元素。(pandoc 解析函数)。我不知道 Haskell,所以这就是我走了多远。

但是,如果您将 html 转换为 markdown,它会保留 alt 和标题,结果类似于

使用 Markdown,您可以在生成的 Latex 文档中包含内联图像或图形。如果将此降价转换为乳胶,则结果是

第一个 pandoc 似乎是解析内容的简单解决方案,但我有点卡住,因为 pandoc 也不支持 html 中的内联乳胶,所以我可以首先通过 pandoc 处理所有图像和其余图​​像。

你们对如何(更好地)处理imghtml中的标签以嵌入到带有标题的乳胶中的图形环境中是否有任何想法?

0 投票
0 回答
2043 浏览

latex - 使用 Pandoc 将 html 转换为 tex 不会产生数学模式

我正在使用 Windows 机器。我使用 Rstudio/knitr 编写 (R)markdown 文件并将其转换为 html 文件。源 Markdown 文件包含一些用 LaTeX 语言输入的数学,因此 html 文件包含一些 Mathjax。

例如,markdown 文件中有以下 LaTeX 代码:

因此预期的输出是:

在此处输入图像描述

此输出正确显示在 html 文件中。

但现在我尝试将此 html 文件转换为 tex 文件:

然后我在输出 tex 文件中得到以下代码:

在使用 (pdf)latex 编译后给出以下渲染:

输出

0 投票
1 回答
739 浏览

pandoc - 不要将 HTML 处理为 Markdown,但保留定义列表

我喜欢 Pandoc 中的定义列表语法。我也有一些原始 HTML 被放入我的文档中。

我不希望 HTML 被解析为 Markdown。我试图--strict强迫 Pandoc 忽略 HTML。这可行,但不幸的是,这会关闭定义列表功能。我可以使用 HTML 来编写我的 DL,但这很乏味。(HTML 来自另一个来源,应该保持不变。)

有没有任何配置选项可以让我对此有更多的粒度?

(请参阅手册中的原始 html部分和定义列表部分。他们都讨论了如何--strict禁用它们。)

0 投票
2 回答
3034 浏览

r - 是否可以在没有 pandoc 的情况下使用 Rstudio 直接从 .Rmd 转换为 LaTeX?

可重现的示例(如果您有 rstudio):

  • 文件 | 新 | R 降价
  • 编织成html,另存为test

针织者

导航到工作目录

  • 在终端(安装 pandoc)中输入

    pandoc -s test.md -t 乳胶 -o test.tex

(结果粘贴在这里

  • 使用 pdflatex 转换为 pdf(请参见此处的结果)

或者直接转到 .pdf 跳过 tex 阶段:

结果很好,但考虑到 knitr 合并了 sweave,这似乎需要很多步骤。它应该能够直接从 .Rmd 转换为 .tex 或 .pdf 。对?

0 投票
4 回答
44145 浏览

markdown - Markdown 到 docx,包括复杂的模板

我已经自动化了我的构建,使用 Pandoc 将 Markdown 文件转换为 DOCX 文件。我什至为最终文档的样式使用了参考文档。我使用的命令是:

reference.docxPandoc 提取,Pandoc使用与参考文档相同的样式进行docs/rendering渲染。mydoc.docx

但是,reference.docx包含的不仅仅是样式。它包含公司徽标、序言等。

如何自动将 Markdown 内容与reference.docx. 我的解决方案需要在 Linux 上运行。

0 投票
1 回答
7505 浏览

latex - pandoc 没有正确转换乳胶样式的引用

我想\cite{key}在我的降价中使用乳胶风格的引用,这样我就可以使用 pandoc 很好地创建 tex 和 pdf 文档。但是,当我引用某些内容时,它会在括号中显示关键字而不是引用样式,例如作者姓名或引用编号。换句话说,我希望它在 PDF 中显示为“这是我的引文 [1]”,而是显示为“这是我的引文 [mykey]”。# References此外,添加标题后,我的参考列表没有显示。这里发生了什么?

下面是用于生成此命令的示例命令以及示例文件和我当前不正确的输出文件 ( test.pdf)。

pandoc test.md --biblatex --biblio test.bib --csl chicago-author-date.csl -o test.pdf

测试.md

测试.bib

测试.pdf

0 投票
1 回答
1537 浏览

pdf-generation - 如何从 pandoc 生成的 LaTeX 中的图形块中删除 `\centering` 标记?

使用 pandoc 从 markdown 生成 PDF 时,markdown 将转换为 LaTeX。我正在使用自定义模板来设置我的 PDF 样式。

当我创建图像链接时:

生成以下 LaTeX。

毫不奇怪,该图像以 PDF 为中心。

如何防止\centering生成标签?

0 投票
1 回答
2100 浏览

markdown - 带有 R Markdown 源和 pandoc 转换的 Word 中的图形标题

我正在使用 Rstudio 用 Rmarkdown 语言编写报告,然后使用 pandoc 将md文件(不是Rmd文件)转换为doc格式。doc每个图形在输出文件中都有一个标题: “plot of chunk unnamed-chunk-xxx”。我当然可以在md文件中修改这个caption,但是不知道是不是可以直接在Rmd文件中修改。

0 投票
2 回答
615 浏览

ruby - nanoc:如何将选项传递给 pandoc-ruby?

我正在尝试将 nanoc 3.5.0 与pandoc使用pandoc-ruby. 具体来说,我无法从我的Rules文件中传递几个选项,以便最终调用PandocRuby.convert()如下所示:

当我将上述调用放在自定义过滤器中时,一切正常。但是,我想指定 pandoc 选项,Rules这样我就不必为每组选项创建一个特殊的过滤器。

默认 pandoc 过滤器被定义为函数run(content, params={})并简单地调用PandocRuby.convert(content, params). params我该如何设置才能PandocRuby.convert()正确调用?以下指令Rules不起作用:

第一个指令导致 Ruby 错误,第二个指令运行但给了我一个空白页,表明 pandoc 没有被正确调用。我对 Ruby 不是很熟悉,所以我目前的努力只是在黑暗中摸索。

0 投票
2 回答
5766 浏览

r - 在 Knitr 中为 md 或 HTML 输出设置页面宽度

我有 knitr 来创建我的统计分析的输出以及数字。我的分析有许多由标题标记的级别。为了获得带有目录的漂亮 html 页面,我使用“pander”(pandoc R 包)将我的 .md 文件转换为 html,因为 knitr 不会在 html 文件中嵌入目录。

问题:当我使用 pander 时,它会创建一个固定宽度的页面(很窄),我的大图需要左右滚动。有没有办法调整 .md 页面宽度或直接 pander 以输出具有自动宽度设置的页面(调整到任何屏幕宽度)。

我确实花时间寻找解决方案:要么让 knitr 芳香地嵌入 TOC,要么将宽度参数嵌入到 r 代码中

或调整pader输出参数但没有任何运气。

如果有人能解决这个问题,我将不胜感激。