我正在尝试将 tex 文件转换为 xml。
特别是,我有兴趣了解是否可以生成一个 TEI xml 文件(http://www.tei-c.org/index.xml)以从 tex 文件在线发布。
有没有关于如何进行的信息?你能强调一个简单的例子来说明如何做到这一点吗?
提前致谢,
露西亚
我正在尝试将 tex 文件转换为 xml。
特别是,我有兴趣了解是否可以生成一个 TEI xml 文件(http://www.tei-c.org/index.xml)以从 tex 文件在线发布。
有没有关于如何进行的信息?你能强调一个简单的例子来说明如何做到这一点吗?
提前致谢,
露西亚
第一:这不是解决问题的魔法,但是,由于问题非常广泛,我的回答希望能描述解决手头问题的合理策略。
我看到了一个问题:虽然 LaTex 用于创建文本的视觉表示,但 TEI 正好相反。它只是描述和编码可以在文本中识别的东西,大部分独立于表示。正因为如此,从 LaTex 到 TEI 的唯一合理方法是以 XML-close 格式(例如 HTML)创建 LaTex 输出的表示,然后在 TEI 中转换该输出。所以你需要一个两步的过程。
我认为这里列出的工具之一将帮助您生成漂亮的 HTML 输出,可能 LaTeXML 非常接近您的需要。之后,您需要将此 HTML 输出转换为 TEI。如果 HTML 元素对您来说足够了,那么或多或少简单的转换就可以完成这项工作,但这取决于您未指定的要求。
顺便说一句,这里有另一个问题触及你的问题,也许它很有趣。
您可以使用 pandoc ( https://pandoc.org/ )。给定一个像这样的 LaTex 文档(我们称之为data.txt
)
\documentclass{article}
\begin{document}
Hello World!
\end{document}
你可以像这样使用 pandoc
pandoc data.txt -f latex -t tei -o latexexample.xml
生成与 TEI XML 一致的 XML:
<p>Hello World!</p>