可能重复:
用 Python 2.6 中相应的 utf-8 字符替换 html 实体 在 Python
中转义 HTML 的最简单方法是什么?
有一种方法可以轻松地将字符串转换为 HTML 字符串,例如将 <、> 等字符替换为,<
>
或者我是否必须编写自己的转换例程?
可能重复:
用 Python 2.6 中相应的 utf-8 字符替换 html 实体 在 Python
中转义 HTML 的最简单方法是什么?
有一种方法可以轻松地将字符串转换为 HTML 字符串,例如将 <、> 等字符替换为,<
>
或者我是否必须编写自己的转换例程?
如果您只关心关键的特殊字符,例如&
,<
和>
:
>>> import cgi
>>> cgi.escape("<hello&goodbye>")
'<hello&goodbye>'
对于其他非 ASCII 字符:
>>> "Übeltäter".encode("ascii", "xmlcharrefreplace")
b'Übeltäter'
当然,如果需要,你可以将两者结合起来:
>>> cgi.escape("<Übeltäter>").encode("ascii", "xmlcharrefreplace")
b'<Übeltäter>'