我有几个 XML 文件,其中包含代码点值介于 57600 和 58607 之间的 unicode 字符。目前这些在我的内容中显示为方块,我想将它们转换为元素。
所以我想要实现的是:
<!-- current input -->
<p> Follow the on-screen instructions.</p>
<!-- desired output-->
<p><unichar value="58208"/> Follow the on-screen instructions.</p>
<!-- Where 58208 is the actual codepoint of the unicode character in question -->
我已经用标记器愚弄了一点,但是由于您需要参考 split ,结果证明这太复杂了。
关于如何最好地解决这个问题的任何建议?我一直在尝试类似下面的一些事情,但被打动了(不要介意语法,我知道这没有任何意义)
<xsl:template match="text()">
-> for every character in my string
-> if string-to-codepoints(current character) greater then 57600 return <unichar value="codepoint value"/>
else return character
</xsl:template>