Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在做一个涉及 NLP 的项目。我需要将泰米尔语字符串音译为英语字符串(以唐语形式),例如“இல்லை”到“illai”..
我怎么能用java做到这一点?帮我看看代码示例
由于泰米尔语块中只有 72 个字符,因此构建一个翻译表,然后通过测试每个字符是否可以翻译来构建一个新字符串,然后再将其添加到列表中。
例如U+0B87(இ) 变成i
U+0B87
i
如果您更熟悉 Java 和/或有大量材料要翻译,可能会有一些处理优化来加快处理速度,但我怀疑以上内容将是一个好的解决方案的基础。
如果您只有少量材料要翻译或者这是一次性工作,那么简单地使用谷歌翻译并在输入框下方获取输入翻译可能更有意义。