2

几个月前我找到了一个公式,我自己将任何源语言(计算机字符)翻译成目标(计算机字符)。使用 Lua(桌面用户)和 C++ 类(用于本机访问),以便我可以将其嵌入 Web 浏览器等。我想知道我们是否已经在 C++ 或 Lua 中有更好的东西。

我的有时它真的不能正确翻译语法甚至规则,在构建它之前我认为我的将是完成它的最佳方式,但它现在需要很长时间,我担心它可能会成为错误的实现。现在我想看看其他人并比较我的。

我使用谷歌翻译或其他不是我的目标,我正在构建一个翻译引擎(如谷歌或其他),有人可以在那里放置字典并创建规则。

是否有任何现有的翻译框架或库(OpenCOG 或 Moses)可以将 Source language 转换为 Destination?例如:阿拉伯语到中文或英语到日语?或者谷歌/其他人还在使用什么?

任何建议将不胜感激

提前致谢。

4

3 回答 3

5

我不想劝阻你,但你正试图单枪匹马地解决机器翻译的问题。像Systran这样的MT 系统已经由科学家和工程师团队开发了几十年,但它们仍然远非完美。

于 2010-12-22T13:59:51.017 回答
4

Moses 是一个非常好的 C++ 开源翻译库。cdec代表当前最先进的技术(但需要源语言和目标语言的上下文无关语法)。两者都需要大量的训练数据,即并行语料库。

完成后,跑到你的大学申请博士学位。

于 2010-12-22T14:11:02.560 回答
0

你看过Google Translator Toolkit API吗?通过分析它的各个方面,您可以大致了解它实现了什么以及开发自己的翻译框架可能需要什么(顺便说一句,工作量很大)。

创建/上传翻译文件

支持的源语言和目标语言的完整列表

http://www.leniel.net/2010/12/playing-google-translator-toolkit-api.html

更多堆栈:

免费/开源机器翻译系统和工具

GNU 获取文本

TinyTM - 开源翻译记忆库

于 2010-12-22T13:56:25.850 回答