我试图找到一个关于统计机器翻译如何工作的高层次解释。也就是说,假设我有一个未对齐的英语、法语和德语文本的语料库,我怎么能用它来将任何句子从一种语言翻译成另一种语言?我并不是想自己构建一个谷歌翻译,而是我想更详细地了解它是如何工作的。
我看过谷歌搜索但没有发现什么好东西,它要么很快需要高级数学知识才能理解,要么过于笼统。维基百科关于 SMT 的文章似乎两者兼而有之,因此并没有太大帮助。我怀疑这是一个如此复杂的领域,如果没有所有的数学知识就根本不可能理解。
任何人都可以给出或知道这样一个系统如何工作的一般分步解释,针对程序员(所以代码示例很好),但不需要数学学位来理解?或者像这样的书也很棒。
编辑:我正在寻找的一个完美的例子是 SMT 相当于Peter Norvig 关于拼写更正的精彩文章。这很好地了解了编写拼写检查器所涉及的内容,而无需深入了解 Levenshtein/soundex/平滑算法等的详细数学...