问题标签 [moses]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
127 浏览

macos - 编译摩西时出错。没有 dist 文件夹或 moses.ini 文件

我是一个初学者程序员,所以我仍在努力掌握一些东西。请温柔一点。

我正在尝试在 OS X 上安装和编译 Moses( http://www.statmt.org/moses/?n=Development.GetStarted ),但遇到了很多问题。

我一直按照这个网站(http://www.statmt.org/moses_steps.html)的说明进行操作,一切顺利,直到我真正编译了摩西。我正在使用以下代码:

这应该在 dist/bin/ 中创建几个文件,包括 moses.ini 解码器本身。但是, dist/bin/ 文件夹根本没有出现。在 Moses 编译过程中,我没有看到任何错误——在我真正检查文件并尝试运行 Moses 之前,一切似乎都很顺利。

当我尝试运行测试时,我使用以下内容:

我收到错误:没有这样的文件或目录。

有谁知道我可能做错了什么?任何和所有的建议将不胜感激。

谢谢!

0 投票
1 回答
555 浏览

perl - moses-SMT 系统中的分词器即使使用 10 个句子也卡住了

我试图制作一个基线 MT 系统。只是为了检查它是如何工作的,我制作了只有 2000 个句子的源 (S) 和目标 (T) 语言语料库。第一步是为机器翻译 (MT) 系统准备数据。在这一步中,我们首先必须执行Baseline SMT中提到的标记化。我用过这段代码:

(说 S = 法语 & T = 英语)

2小时后我检查它仍在运行。我很好奇,因为它没有预料到。然后我只用了十句话。令我惊讶的是,已经 30 分钟了,它仍在运行。

我做错什么了吗?

PS:OS = Ubuntu 14.04.5 LTS Sony ultrabook 没有双启动。

0 投票
0 回答
108 浏览

nlp - 最先进的语言翻译工具包

我需要将西班牙语推文翻译成英文进行研究。我找到了一些工具包。其中,Moses被一些研究论文使用,其他新兴工具包将其用作评估目的的基准。所以我正在考虑将其作为候选人。另外,我从斯坦福大学找到了一个名为Phrsal的工具包,它似乎也不错。我找到的最后一个来自著名的nltk图书馆。它还有一个翻译包。他们每个人都说他们使用phrase based statistical machine translation技术和其他一些技术。现在我的问题是,从实践或理论的角度来看,哪个最适合用于推文翻译。或者google translator api将是最好的解决方案?

0 投票
1 回答
232 浏览

regex - ($pre =~ /\./ && $pre =~ /\p{IsAlpha}/) 在 Moses Tokenizer 中是什么意思?

Moses Tokenizer是机器翻译和自然语言处理实验中广泛使用的分词器。

有一行正则表达式检查:

如果我错了请纠正我,第二和第三个条件是检查

  • 前缀是否在不间断前缀列表中
  • 该单词是否不是最后一个标记,并且仍然有一个小写标记作为下一个单词。

问题在于它检查的第一个条件:

  1. 检查前缀是否是$pre =~ /\./单个句号?

  2. 并且正在$pre =~ /\p{IsAlpha}/检查前缀是否是perluniprop中字母列表中的字母?

  3. 一个相关的问题是句号是否已经在 perluniprop 字母表中?如果是这样,这个条件不是永远不会成立吗?

0 投票
1 回答
145 浏览

moses - moses 错误:无法读取 /phrase-model/moses.ini

我刚刚安装 moses 2.1 ,在尝试示例模型时出现错误:无法读取 /phrase-model/moses.ini

我发送的命令是 echo 'das ist ein kleines haus' | /Users/kagrawal/Desktop/tools/moses/bin/moses -f /phrase-model/moses.ini <phrase-model/in > 从我的示例模型文件夹中出来。

0 投票
0 回答
85 浏览

moses - 如何将摩西解码器翻译写入文件?

我正在尝试测试摩西解码器。我有大量数据,我需要将它们的翻译记录到一个文件中。我的意思是把所有的数据都给摩西,然后把翻译记录到一个文件中。有谁能帮助我吗?我使用了这个链接:http ://www.statmt.org/moses/?n= Moses.Baseline 现在我可以给它一个句子以便翻译。谢谢!

0 投票
1 回答
406 浏览

machine-translation - giza++ 短语表中的计数是什么意思?

我一直在官方网站(和 pdf 手册)中搜索 giza++ 短语表输出中数字的含义:http: //www.statmt.org/moses/? n=FactoredTraining.ScorePhrases

这就是我想出的。

假设这是短语表中的一行

这意味着:

这些都很有道理。

然而,如果我使用文本编辑器进行文本搜索,我会得到:

即,完全不同的数字。

另一个奇怪的地方是:

所以,考虑到官网的解释,

一种解释可能是它可能正好相反。

但是,实际计数(“the”)是 21466。

是否有其他一些教程/手册可以更好地阐明 giza++ 输出文件的内容?

0 投票
0 回答
176 浏览

java - 如何在 Apache Tika 中使用 Moses Translator?

我正在尝试在 Java 项目中使用 Apache Tika 进行机器翻译,特别是 MosesTranslator 类。我已按照此链接中给出的说明安装了 Moses 。

然而,在 MosesTranslator 的文档中,我们需要在构造函数中提供两个变量,smtPath 和 scriptsPath。

MosesTranslator(字符串 smtPath,字符串 scriptPath)

应该为这些变量提供什么值?似乎 smtPath 应该是 Moses 的某个 jar 文件的路径,但是在安装 Moses 后我不能使用任何 jar 文件。

0 投票
1 回答
289 浏览

xml - 使用 xml-rpc 调用 Moses 作为服务的翻译方法失败

我正面临一个异常调用 moses(统计机器翻译)作为安装了 xmlrpc 的服务。我首先打开了一个到摩西服务器的端口

但主要问题是当我发送一个带有 xml 作为正文参数的休息请求时。

当我在http://xxx.xxx.xxx.xxx:8082/RPC2上将其作为 POST 请求执行时

我注意到端口上的服务失败并出现异常“在抛出 'xmlrpc_c::fault' Aborted 的实例后调用终止”

我认为主要问题在于 xml 正文结构,但我在网上找不到任何有关翻译方法的文档。有什么建议么?谢谢你。

更新

请注意,如果我打开一个带有设置的端口

我从来没有得到回应。

0 投票
1 回答
91 浏览

python - perl 正则表达式之间的区别在摩西的两个数字之间添加点

上下文,我正在尝试将 Perl 代码从https://github.com/moses-smt/mosesdecoder/blob/master/scripts/tokenizer/normalize-punctuation.perl#L87移植到 Python 中,这里有这个正则表达式珀尔:

如果我在给定输入 text 的 Perl 脚本中尝试它123 45,它会返回带有点的相同字符串。作为健全性检查,我也在命令行上尝试过:

[出去]:

当我将正则表达式转换为 Python 时也是如此,

但是当我使用摩西脚本时:

即使我们尝试在摩西代码中的正则表达式之前和之后打印字符串,即

[出去]:

我们看到在正则表达式之前和之后,字符串没有变化。

我的部分问题是:

  • Python\g<1>.\g<2>正则表达式是否等同于 Perl 的$1.$2
  • 为什么 Perl 正则表达式没有.在 Moses 的两位数组之间添加句号?
  • 如何在 Python 正则表达式中复制 Perl 在 Moses 中的行为?
  • 如何在摩西的 Perl 正则表达式中复制 Python 的行为?