问题标签 [pandoc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 LaTeX 中将 HTML img 标签转换为带有标题的图形
我正在编写一个 python 脚本来解析 Wordpress Export XML (wp xml) 的内容以生成 LaTex 文档。到目前为止, wp xml 被解析lxml.etree
,代码生成一个新的 xml 树,由texml处理,然后生成 tex 文件。
目前,我提取每个帖子以及某些元数据(标题、发布日期、标签、内容)。元数据没有问题,但内容部分有点问题。在 wp xml 中,内容作为 CDATA 结构包含在纯 HTML/Wordpress 标记中。要将其转换为乳胶,我选择pandoc来解析内容。TeXml 支持内联 LaTeX,因此内容作为纯 LaTeX 添加到树中。
我决定在这种情况下使用 pandoc,因为它已经很好地转换了大多数 html 标签(a
, strong
, em
...),我唯一的问题是它如何处理图像。
我使用子进程与 pandoc 交互:
示例帖子可能如下所示
我需要带有嵌入标题的图像,例如
pandoc 似乎将 htmlimg
标签转换为简单的内联图像,丢弃任何标题或替代文本。
我确实窥视了源代码,它看起来img
只被视为内联元素。(pandoc 解析函数)。我不知道 Haskell,所以这就是我走了多远。
但是,如果您将 html 转换为 markdown,它会保留 alt 和标题,结果类似于
使用 Markdown,您可以在生成的 Latex 文档中包含内联图像或图形。如果将此降价转换为乳胶,则结果是
第一个 pandoc 似乎是解析内容的简单解决方案,但我有点卡住,因为 pandoc 也不支持 html 中的内联乳胶,所以我可以首先通过 pandoc 处理所有图像和其余图像。
你们对如何(更好地)处理img
html中的标签以嵌入到带有标题的乳胶中的图形环境中是否有任何想法?
latex - 使用 Pandoc 将 html 转换为 tex 不会产生数学模式
我正在使用 Windows 机器。我使用 Rstudio/knitr 编写 (R)markdown 文件并将其转换为 html 文件。源 Markdown 文件包含一些用 LaTeX 语言输入的数学,因此 html 文件包含一些 Mathjax。
例如,markdown 文件中有以下 LaTeX 代码:
因此预期的输出是:
此输出正确显示在 html 文件中。
但现在我尝试将此 html 文件转换为 tex 文件:
然后我在输出 tex 文件中得到以下代码:
在使用 (pdf)latex 编译后给出以下渲染:
markdown - Markdown 到 docx,包括复杂的模板
我已经自动化了我的构建,使用 Pandoc 将 Markdown 文件转换为 DOCX 文件。我什至为最终文档的样式使用了参考文档。我使用的命令是:
由reference.docx
Pandoc 提取,Pandoc使用与参考文档相同的样式进行docs/rendering
渲染。mydoc.docx
但是,reference.docx
包含的不仅仅是样式。它包含公司徽标、序言等。
如何自动将 Markdown 内容与reference.docx
. 我的解决方案需要在 Linux 上运行。
latex - pandoc 没有正确转换乳胶样式的引用
我想\cite{key}
在我的降价中使用乳胶风格的引用,这样我就可以使用 pandoc 很好地创建 tex 和 pdf 文档。但是,当我引用某些内容时,它会在括号中显示关键字而不是引用样式,例如作者姓名或引用编号。换句话说,我希望它在 PDF 中显示为“这是我的引文 [1]”,而是显示为“这是我的引文 [mykey]”。# References
此外,添加标题后,我的参考列表没有显示。这里发生了什么?
下面是用于生成此命令的示例命令以及示例文件和我当前不正确的输出文件 ( test.pdf
)。
pandoc test.md --biblatex --biblio test.bib --csl chicago-author-date.csl -o test.pdf
测试.md
测试.bib
测试.pdf
pdf-generation - 如何从 pandoc 生成的 LaTeX 中的图形块中删除 `\centering` 标记?
使用 pandoc 从 markdown 生成 PDF 时,markdown 将转换为 LaTeX。我正在使用自定义模板来设置我的 PDF 样式。
当我创建图像链接时:
生成以下 LaTeX。
毫不奇怪,该图像以 PDF 为中心。
如何防止\centering
生成标签?
markdown - 带有 R Markdown 源和 pandoc 转换的 Word 中的图形标题
我正在使用 Rstudio 用 Rmarkdown 语言编写报告,然后使用 pandoc 将md
文件(不是Rmd
文件)转换为doc
格式。doc
每个图形在输出文件中都有一个标题: “plot of chunk unnamed-chunk-xxx”。我当然可以在md
文件中修改这个caption,但是不知道是不是可以直接在Rmd
文件中修改。
ruby - nanoc:如何将选项传递给 pandoc-ruby?
我正在尝试将 nanoc 3.5.0 与pandoc
使用pandoc-ruby
. 具体来说,我无法从我的Rules
文件中传递几个选项,以便最终调用PandocRuby.convert()
如下所示:
当我将上述调用放在自定义过滤器中时,一切正常。但是,我想指定 pandoc 选项,Rules
这样我就不必为每组选项创建一个特殊的过滤器。
默认 pandoc 过滤器被定义为函数run(content, params={})
并简单地调用PandocRuby.convert(content, params)
. params
我该如何设置才能PandocRuby.convert()
正确调用?以下指令Rules
不起作用:
第一个指令导致 Ruby 错误,第二个指令运行但给了我一个空白页,表明 pandoc 没有被正确调用。我对 Ruby 不是很熟悉,所以我目前的努力只是在黑暗中摸索。
r - 在 Knitr 中为 md 或 HTML 输出设置页面宽度
我有 knitr 来创建我的统计分析的输出以及数字。我的分析有许多由标题标记的级别。为了获得带有目录的漂亮 html 页面,我使用“pander”(pandoc R 包)将我的 .md 文件转换为 html,因为 knitr 不会在 html 文件中嵌入目录。
问题:当我使用 pander 时,它会创建一个固定宽度的页面(很窄),我的大图需要左右滚动。有没有办法调整 .md 页面宽度或直接 pander 以输出具有自动宽度设置的页面(调整到任何屏幕宽度)。
我确实花时间寻找解决方案:要么让 knitr 芳香地嵌入 TOC,要么将宽度参数嵌入到 r 代码中
或调整pader输出参数但没有任何运气。
如果有人能解决这个问题,我将不胜感激。