我有一个日文内容,正在使用某个工具转换为 MS 帮助。问题是第三方工具没有使用 utf-8 编码,而是创建了一个带有垃圾字符的 .xml:
<param name="Name" value="ÉAÉvÉäÉPÅÉVÉáÉìdžÇ'ÇËÇØÅǵÇÃ'ÇÃ']">
<param name="Name" value="Test File">
<param name="Local" value="applications.htm#Xau1044547">
我尝试使用编码,它现在产生:
<param name="Name" value="ÉAÉvÉäÉPÅ">
<param name="Name" value="Test">
<param name="Local" value="applications.htm#Xau1044547">
但是使用 utf-8 编码(另一种工具),正确的输出应该是:
<param name="Name" value="アプリケーション">
<param name="Name" value="Small Business アプリケーションの起動 ">
<param name="Local" value="applications1.html#wp1044548">
是否有任何 java API 可用于对文件进行解码和编码以获得正确的输出。我不确定该工具使用的是什么,但我猜测它的“ISO-8859-1”。
谢谢。