我有一些 html 包含我使用 MathType 从 Word 文档生成的 mml。我有一个使用 BeautifulSoup 美化它的 python 脚本,但问题是它需要类似的东西∠
并将其转换为实际的字节序列0xE2 0x88 0xA0
,即∠符号。这是一个问题,因为0xE2 0x88 0xA0
不会在浏览器中显示为∠。相反,浏览器将其解释为一系列拉丁字符。这也发生在所有数学实体上,例如 Δ ∠ − +... 等。
我查看了 BeautifulSoup 文档,可以看到如何将实体转换为字节序列,但我没有使用该命令;我正在使用的是 prettify()。而且我在 BeautifulSoup 文档中没有看到不将实体转换为字节序列的方法。
有谁知道 BeautifulSoup 中是否有设置告诉它不要将实体更改为字节序列?我希望如此,因为在美化运行后必须撤消损坏似乎有点愚蠢:)
在此先感谢您的帮助!