我需要导出信息,导出的文本必须翻译。在数据库中,数据是未翻译的形式。我的应用程序要求说用户还必须能够将导出的 CSV 文件导入数据库,所以我需要将翻译的文本反向转换为 I18N 格式,这是数据库中的数据格式。我该怎么做,或者有什么理智的方法可以做到这一点?
问问题
1045 次
2 回答
2
我同意你的看法。在一般情况下,这似乎很不理智!就像是: !!!
- 将所有翻译的字符串作为模式,一个一个(使用一些优先级)
- 当模式匹配时,将其替换为该模式的未翻译值
- 循环直到完成!!!
可以设想很多问题...
这涉及到自然语言处理的研究领域。所以这很好......研究!在日常编程中并不容易使用!
但如果你有兴趣,谷歌搜索应该会找到一些算法。我相信它们是建立在一个复杂的模型上的(与正则表达式相比!)。
我希望你有一些其他信息可以指导你......有了更多的上下文,这可能是一个更容易的问题......
于 2009-09-28T12:26:46.757 回答
0
您需要维护已翻译消息的字典表。您可能已经以某种形式拥有了一个。
Master message list
| Message key | English text |
| 1 | Payment rejected |
Translations
|Translation | Message key |
|Paiement rejeté | 1 |
|Talu Gwrthodwyd | 1 |
|Maksu hylätty | 1 |
您可以使用连接从数据导入中搜索已翻译的文本,并将其映射回未翻译的文本(或仅存储消息密钥)。
通过“减少”翻译的文本来使其更健壮可能值得 - 去除不需要的空格,替换重音字符等。在存储翻译之前和搜索之前执行此操作。数据库索引应该使搜索快速。
于 2009-09-28T14:01:24.657 回答