python - pybtex 是否支持 .bib 文件中的重音/特殊字符？

Question

from pybtex.database.input import bibtex
parser = bibtex.Parser()
bibdata = parser.parse_file("sample.bib")

上面的代码片段在解析 .bib 文件时效果很好，但它似乎不支持重音字符，如{\"u}或\"{u}（来自 LaTeX）。就像确认 pybtex 是否支持那样。

例如，根据LaTeX/Special Characters和How to write "ä" 和其他变音符号和重音字母在参考书目中？,\"{o}应该转换为ö, 也是如此{\"o}。

score 4 · Accepted Answer

更新：从 0.20 版开始，pybtex 现在支持此功能。

目前没有。但是您可以在使用 pybtex 处理它之前使用乳胶编解码器读取 bib 文件，例如使用https://pypi.python.org/pypi/latexcodec/此编解码器将为您将（广泛的）LaTeX 命令转换为 unicode .

但是，您必须在后处理阶段删除括号。为什么？为了优雅地处理 bibtex 代码，\"{U} 必须将其转换为{Ü}而不是转换为Ü以防止它在标题中被小写。以下示例演示了这种行为：

import pybtex.database.input.bibtex
import pybtex.plugin
import codecs
import latexcodec

style = pybtex.plugin.find_plugin('pybtex.style.formatting', 'plain')()
backend = pybtex.plugin.find_plugin('pybtex.backends', 'latex')()
parser = pybtex.database.input.bibtex.Parser()
with codecs.open("test.bib", encoding="latex") as stream:
    # this shows what the latexcodec does to the source
    print stream.read()
with codecs.open("test.bib", encoding="latex") as stream:
    data = parser.parse_stream(stream)
for entry in style.format_entries(data.entries.itervalues()):
    print entry.text.render(backend)

test.bib 在哪里

@Article{test,
  author =       {John Doe},
  title =        {Testing \"UTEST \"{U}TEST},
  journal =      {Journal of Test},
  year =         {2000},
}

这将打印 latexcodec 如何将 test.bib 转换为 unicode（为便于阅读而编辑）：

@Article{test,
   author = {John Doe}, title = {Testing ÜTEST {Ü}TEST},
   journal = {Journal of Test}, year = {2000},
}

其次是 pybtex 呈现的条目（在这种情况下，生成乳胶代码）：

John Doe.
\newblock Testing ütest {Ü}test.
\newblock \emph{Journal of Test}, 2000.

如果编解码器要去掉括号，pybtex 会错误地转换大小写。此外，在（病理）情况下，journal = {\"u}显然也不能删除括号。

一个明显的缺点是，如果您渲染到非 LaTeX 后端，那么您必须在后处理阶段删除括号。但是您可能仍然希望这样做来处理任何特殊的 LaTeX 命令（例如\url）。如果 pybtex 能以某种方式为您做到这一点，那就太好了，但目前还没有。

score 2 · Accepted Answer

pylatexenc ( https://pypi.org/project/pylatexenc/ )

from pylatexenc.latex2text import LatexNodes2Text 

latex_text = 'Gl{\\"o}ckner'
text = LatexNodes2Text().latex_to_text(latex_text)

print(text) # Glöckner

python - pybtex 是否支持 .bib 文件中的重音/特殊字符？

2 回答 2

Related

Reference