使用 icu4j-63.1 库,我们将本机文本音译为项目的 ascii 字符。在少数情况下,音译没有按预期工作。
如果我在这里遗漏了什么,请告诉我。
下面的代码用于音译
Transliterator any2Latin = Transliterator.getInstance("Any-Latin/UNGEGN; Latin; Title");
Transliterator latin2Ascii = Transliterator.getInstance("Latin-ASCII");
latin2Ascii.transliterate(any2Latin.transliterate(<<Input String>>))
以下是无法进行音译的示例文本列表,即输入和输出字符串都相同。
- THE L±NFANT TRUST(预计将±音译为+/-。但输出与给定字符串相同)。
- 唐¢A
- 詹姆·卡斯塔隆
- ENGº JOSE BARATA
- TERRY STUARDCB¬NEWTONRAY¬
- ¥YOUNG© (此处,© 已成功转换为 (C) 但不是日元符号。日元符号保持相同的后音译)