1

我正在使用 TeX 宏包 Context 生成 pdf。Context 源文件使用 Django 模板生成,内容使用 Pandoc 从 HTML(存储在数据库中)转换为 Context 的语法。由于 Pandoc 没有原生 python 绑定,我创建了以下模板过滤器来将 HTML 转换为上下文:

def html2context(value):
    """
     Runs pandoc to convert from HTML to Context.

    Syntax::

    {{ value|html2context }}
    """
    cmd = 'pandoc -f html -t context'
    p1 = subprocess.Popen(cmd.split(" "), stdout=subprocess.PIPE, stdin=subprocess.PIPE)
    (stdout, stderr) = p1.communicate(input=value.encode('utf-8'))
    return mark_safe(stdout)

问题是,为了生成我的 pdf,我多次调用模板过滤器,以非常缓慢的转换过程结束。我必须多次调用过滤器的原因是因为我的模板混合了来自数据库的内容和原始 Context 命令来构建我的文档:HTML 没有涵盖我在 Context 中需要的所有可能性。我的模板的一个最小示例如下所示:

{% for plugin in intro %}
    {{ plugin.text.body|html2context }}
    \page[emptyodd]
{% endfor %}

您知道如何使转换过程不那么理想吗?

谢谢

4

1 回答 1

0

我认为更好的解决方案是直接在 ConTeXT 中创建一个模板,并生成这样的视图:

from django.http import HttpResponse
   from django.template import Context
   from django.template.loader import get_template
   from subprocess import Popen, PIPE
   import tempfile
   from .models import Entry

   def entry_as_pdf(request, pk):
       entry = Entry.objects.get(pk=pk)  
       context = Context({  
            'content': entry.content,
                 })
       template = get_template('my_latex_template.tex')
       rendered_tpl = template.render(context).encode('utf-8')  
     # Python3 only. For python2 check out the docs!
       with tempfile.TemporaryDirectory() as tempdir:  
        # Create subprocess, supress output with PIPE and
        # run latex twice to generate the TOC properly.
        # Finally read the generated pdf.
            for i in range(2):
                process = Popen(
                ['context', '-output-directory', tempdir],
                    stdin=PIPE,
                    stdout=PIPE,
                )
                process.communicate(rendered_tpl)
            with open(os.path.join(tempdir, 'texput.pdf'), 'rb') as f:
                pdf = f.read()
        r = HttpResponse(content_type='application/pdf')  
        # r['Content-Disposition'] = 'attachment; filename=texput.pdf'
        r.write(pdf)
        return r

请注意,context如果您在文档中包含诸如 TOC 或参考书目参考之类的内容,则会有一个循环运行该命令两次,

于 2017-02-08T09:57:03.643 回答