6
from pybtex.database.input import bibtex
parser = bibtex.Parser()
bibdata = parser.parse_file("sample.bib")

上面的代码片段在解析 .bib 文件时效果很好,但它似乎不支持重音字符,如{\"u}\"{u}(来自 LaTeX)。就像确认 pybtex 是否支持那样。

例如,根据LaTeX/Special CharactersHow to write "ä" 和其他变音符号和重音字母在参考书目中?,\"{o}应该转换为ö, 也是如此{\"o}

4

2 回答 2

4

更新:从 0.20 版开始,pybtex 现在支持此功能。

目前没有。但是您可以在使用 pybtex 处理它之前使用乳胶编解码器读取 bib 文件,例如使用https://pypi.python.org/pypi/latexcodec/此编解码器将为您将(广泛的)LaTeX 命令转换为 unicode .

但是,您必须在后处理阶段删除括号。为什么?为了优雅地处理 bibtex 代码,\"{U} 必须将其转换为{Ü}而不是转换为Ü以防止它在标题中被小写。以下示例演示了这种行为:

import pybtex.database.input.bibtex
import pybtex.plugin
import codecs
import latexcodec

style = pybtex.plugin.find_plugin('pybtex.style.formatting', 'plain')()
backend = pybtex.plugin.find_plugin('pybtex.backends', 'latex')()
parser = pybtex.database.input.bibtex.Parser()
with codecs.open("test.bib", encoding="latex") as stream:
    # this shows what the latexcodec does to the source
    print stream.read()
with codecs.open("test.bib", encoding="latex") as stream:
    data = parser.parse_stream(stream)
for entry in style.format_entries(data.entries.itervalues()):
    print entry.text.render(backend)

test.bib 在哪里

@Article{test,
  author =       {John Doe},
  title =        {Testing \"UTEST \"{U}TEST},
  journal =      {Journal of Test},
  year =         {2000},
}

这将打印 latexcodec 如何将 test.bib 转换为 unicode(为便于阅读而编辑):

@Article{test,
   author = {John Doe}, title = {Testing ÜTEST {Ü}TEST},
   journal = {Journal of Test}, year = {2000},
}

其次是 pybtex 呈现的条目(在这种情况下,生成乳胶代码):

John Doe.
\newblock Testing ütest {Ü}test.
\newblock \emph{Journal of Test}, 2000.

如果编解码器要去掉括号,pybtex 会错误地转换大小写。此外,在(病理)情况下,journal = {\"u}显然也不能删除括号。

一个明显的缺点是,如果您渲染到非 LaTeX 后端,那么您必须在后处理阶段删除括号。但是您可能仍然希望这样做来处理任何特殊的 LaTeX 命令(例如\url)。如果 pybtex 能以某种方式为您做到这一点,那就太好了,但目前还没有。

于 2013-11-03T14:54:27.043 回答
2

pylatexenc ( https://pypi.org/project/pylatexenc/ )

from pylatexenc.latex2text import LatexNodes2Text 

latex_text = 'Gl{\\"o}ckner'
text = LatexNodes2Text().latex_to_text(latex_text)

print(text) # Glöckner


于 2019-12-17T04:18:43.780 回答