1

我需要导出信息,导出的文本必须翻译。在数据库中,数据是未翻译的形式。我的应用程序要求说用户还必须能够将导出的 CSV 文件导入数据库,所以我需要将翻译的文本反向转换为 I18N 格式,这是数据库中的数据格式。我该怎么做,或者有什么理智的方法可以做到这一点?

4

2 回答 2

2

我同意你的看法。在一般情况下,这似乎很不理智!就像是: !!!

  • 将所有翻译的字符串作为模式,一个一个(使用一些优先级)
  • 当模式匹配时,将其替换为该模式的未翻译值
  • 循环直到完成!!!

可以设想很多问题...


这涉及到自然语言处理的研究领域。所以这很好......研究!在日常编程中并不容易使用!

但如果你有兴趣,谷歌搜索应该会找到一些算法。我相信它们是建立在一个复杂的模型上的(与正则表达式相比!)。


我希望你有一些其他信息可以指导你......有了更多的上下文,这可能是一个更容易的问题......

于 2009-09-28T12:26:46.757 回答
0

您需要维护已翻译消息的字典表。您可能已经以某种形式拥有了一个。

Master message list
| Message key | English text     |
| 1           | Payment rejected |

Translations
|Translation       | Message key |
|Paiement rejeté   | 1           |
|Talu Gwrthodwyd   | 1           |
|Maksu hylätty     | 1           |

您可以使用连接从数据导入中搜索已翻译的文本,并将其映射回未翻译的文本(或仅存储消息密钥)。

通过“减少”翻译的文本来使其更健壮可能值得 - 去除不需要的空格,替换重音字符等。在存储翻译之前和搜索之前执行此操作。数据库索引应该使搜索快速。

于 2009-09-28T14:01:24.657 回答