我有一个相当大的 XSLT 模板,其中包含双语文本(UTF-8 中的国家字符)。我正在寻找一个函数,它将重新编码CDATA
内部的所有元素以使用 XML#
实体,允许我将 XSLT 存储为纯US-ASCII
编码。
这是一个基本示例:
<?xml version="1.0" encoding="UTF-8"?>
<test>Soirée</test>
whereé
被编码为C3 A9
. 所需的输出将是
<?xml version="1.0" encoding="US-ASCII"?>
<test>Soirée</test>
其中é
对应于 的代码点'LATIN SMALL LETTER E WITH ACUTE' (U+00E9)
。在第一个示例中更改编码前导码会导致错误,因为 UTF-8 字节变得无效。
有没有一种简单的方法可以做到这一点,还是我必须求助于宏?