如果使用 lxml 读取并输出以下字符串,则元音变音将转换为实体。
import xml.etree.ElementTree as ET
root = ET.fromstring("<r><s>Die Häuser haben Dächer.</s></r>")
as_text = ET.tostring(root).decode("utf-8")
print(as_text)
输出:
<r><s>Die Häuser haben Dächer.</s></r>
预期输出:
<r><s>Die Häuser haben Dächer.</s></r>
变音符号只是一个例子。我通常想禁用实体转换,而是保留原始输入符号。
我可以禁用实体转换吗?有没有一种安全的方法来重新转换实体?