11

我试图找到一个关于统计机器翻译如何工作的高层次解释。也就是说,假设我有一个未对齐的英语、法语和德语文本的语料库,我怎么能用它来将任何句子从一种语言翻译成另一种语言?我并不是想自己构建一个谷歌翻译,而是我想更详细地了解它是如何工作的。

我看过谷歌搜索但没有发现什么好东西,它要么很快需要高级数学知识才能理解,要么过于笼统。维基百科关于 SMT 的文章似乎两者兼而有之,因此并没有太大帮助。我怀疑这是一个如此复杂的领域,如果没有所有的数学知识就根本不可能理解。

任何人都可以给出或知道这样一个系统如何工作的一般分步解释,针对程序员(所以代码示例很好),但不需要数学学位来理解?或者像这样的书也很棒。

编辑:我正在寻找的一个完美的例子是 SMT 相当于Peter Norvig 关于拼写更正的精彩文章。这很好地了解了编写拼写检查器所涉及的内容,而无需深入了解 Levenshtein/soundex/平滑算法等的详细数学...

4

3 回答 3

3

这是一个很好的视频讲座(分为两部分):

http://videolectures.net/aerfaiss08_koehn_pbfs/

对于深入的细节,我强烈推荐这本书:

http://www.amazon.com/Statistical-Machine-Translation-Philipp-Koehn/dp/0521874157

两者都来自创建研究中使用最广泛的 MT 系统的人。它涵盖了所有基本的东西,解释得很好而且准确。这可能是该领域的任何研究人员都应该阅读的事实上的标准书籍之一。

于 2011-06-23T18:48:08.737 回答
3

早在 1998 年 12 月,The Atlantic Online 就对统计机器翻译进行了非常直截了当的非技术性描述:

斯蒂芬·布迪安斯基迷失在翻译中

我以前读过关于统计机器翻译的非技术性内容,但总是想知道“是的,但是当词序不同并且据说没有使用字典和语法时,统计内容如何知道哪些词映射到哪个词?” 好吧,这篇文章实际上确实回答了这个问题,而且它简单明了,我很惊讶。

于 2011-08-04T16:58:31.733 回答
0

2007 年 Google 开发者日的 Peter Norvig 演讲,从数据理论化:避免资本错误,包含对统计机器翻译原理的一些易于理解的高级解释(从大约 21:20 开始)。

于 2011-04-29T06:46:39.737 回答