问题标签 [moses]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
8747 浏览

c++ - moses 中对“gzopen”的未定义引用

我目前正在尝试安装 moses 脚本,这是机器翻译工具 moses 的一部分,但不断出现错误:

我在 Ubuntu 11.10 中使用 gcc 4.6.1,并且已经安装了 zlib1g-dev 包。摩西源码是最新的(2010-08-13)。

我该怎么办?我需要安装一些额外的软件包吗?

0 投票
2 回答
3636 浏览

java - 使用 apache xml rpc 客户端 3.1.3 发送复杂类型

所以我试图用 Java 向 moses xml-rpc 服务器发送一条 xml-rpc 消息,但不断出现错误:

我正在使用来自http://ws.apache.org/xmlrpc/client.html的 Apache xmlrpc 客户端 3.1.3 。我的猜测是参数定义不兼容,但是在尝试使用不同的类型作为输入后,输出仍然相同。我有一个客户端示例,但它是用 perl 编写的:

这是我的代码:

这是对的吗?

谢谢您的帮助

0 投票
1 回答
515 浏览

localization - 摩西 - 在线集成

我们实际上希望将 Moses 集成到我们的本地化工作流程中。我们的应用程序是用 Java 编写的,我们正在研究通过 xml-rpc 调用来使用 Moses 的功能。

具体来说,我们正在研究以下 API:

  1. 增量训练(即避免每次我们希望使用一些新的训练数据时都从头开始重新训练模型)
  2. 特定领域的训练(即它应该为输入数据所属的每个领域维护单独的短语表),
  3. 解码

该教程说这些可以通过 xml-rpc 调用来实现。但是,我没有找到任何例子或明确的方法来做到这一点。有人可以提供一些例子吗?

另外,我想知道训练和解码阶段是否可以以分布式方式完成。

谢谢!

0 投票
1 回答
2117 浏览

moses - 摩西服务器安装

我已经成功安装了 moses,我还通过 sudo apt-get install libxmlrpc-core-c3 安装了 xmlrpc-c 然后我通过 ./bjam --with-xmlrpc-c=[/path/to/xmlrpc- 构建了 moses c-配置]。在执行这些操作时,我遵循了http://www.statmt.org/moses/?n=Development.GetStarted中的说明。到那时,我想一切都是正确的。从现在开始,我需要连接到安装 moses 的机器,但是我无法启动 mosesserver。我应该如何处理 mosesdecoder/contrib/server/mosesserver.cpp 中的文件。我认为在构建之后应该在那里创建一个可执行文件,还是我要手动编译它?顺便说一句,这是远程版本:x86_64 x86_64 x86_64 GNU/Linux。

提前致谢...

0 投票
1 回答
435 浏览

machine-learning - Giza++ 的糟糕结果和评估

我曾尝试在窗口上使用 giza++(使用 Cygwin 编译器)。我使用了这段代码:

//假设源语言是法语,目标语言是英语

但是在从 giza++ 获取输出文件并评估输出后,我观察到结果太糟糕了。

我的评估结果是:

召回 = 0.0889

精度 = 0.0990

F_MEASURE = 0.0937

AER = 0.9035

有没有人知道原因?原因可能是我忘记了一些参数或者我应该更改其中一些参数?

换句话说:

首先,我想通过大量数据训练 giza++,然后通过小型语料库对其进行测试,并通过所需的对齐方式(GOLD STANDARD)比较其结果,但我在 web.xml 中找不到任何文档或有用的页面。

你能介绍有用的文件吗?

因此,我通过小型语料库(447 句)运行它并通过所需的对齐方式比较结果。你认为这是正确的方法吗?

我也改变了我的代码,得到了更好的结果,但它仍然不好:

GIZA++ -S testlowsf.f.vcb -T testlowde.e.vcb -C testlowsf.f_testlowde.e.snt -m1 5 -m2 0 -mh 5 -m3 5 -m4 0 -CoocurrenceFile inputcooc.cooc -o dictionary -model1dumpfrequency 1 -model4smoothfactor 0.4 -nodumps 0 -nsmooth 4 -onlyaldumps 1 -p0 0.999 -diagonal yes -final yes

评估结果:

// 假设 A 是 GIZA++ 的结果,G 是黄金标准。As 和 Gs 是 A 和 G 文件中的 S 链接。Ap 和 Gp 是 A 和 G 文件中的 p 链接。

RECALL = 相交 Gs/Gs = 0.6295

精度 = Ap 相交 Gp/A = 0.1090

FMEASURE = (2*PRECISION*RECALL)/(RECALL + PRECISION) = 0.1859

AER = 1 - ((As 相交 Gs + Ap 相交 Gp)/(A + S)) = 0.7425

你知道原因吗?

0 投票
1 回答
125 浏览

git - 从已转换为 Git 的 SVN 存储库下载修订版

我必须下载特定版本的软件 (Moses) 才能运行另一款软件。

安装脚本尝试运行

svn co https://mosesdecoder.svn.sourceforge.net/svnroot/mosesdecoder/trunk moses -r 3284

然而,Moses 已将其存储库转换为 Git。

虽然希望保留修订号(否则我会搞砸),下载此版本的等效 Git 命令是什么?Moses 现在托管在 GibHub https://github.com/moses-smt/mosesdecoder上。

我试图查看 Git 的文档,但我发现它有一个很好的学习曲线,因为它与 SVN 完全不同(我对此非常了解)。我只需要从 Git 下载特定的修订版。

0 投票
1 回答
259 浏览

c++ - C++ - 运行摩西解码器时区域设置名称无效异常

按照此处描述的步骤,我已经在我的机器(Windows 7 64 位)上成功编译了 Moses(v0.91)。但是,当我第一次尝试通过在 cygwin 中运行此命令来运行它时:

发生以下异常:

有人知道我做错了什么吗?

0 投票
1 回答
233 浏览

java - 如何在没有回显连接的情况下编写此特定命令?

我正在使用这里教程中给出的这个命令 http://www.statmt.org/moses/?n=Moses.Baseline

它工作正常且正确,但我需要在没有 echo 命令的情况下运行它。因为我想在 JAVA (Eclipse) 中运行这个命令并且连接有问题。甚至

也没有运行。虽然像 ls,pwd 这样的简单命令可以正常工作。

我尝试了这些东西,但它们都不起作用..

/home/saj/g2p/mosesdecoder-master/bin/moses -f /home/saj/g2p/working/binarised-model/moses.ini 'TWONEIGH T'

/home/saj/g2p/mosesdecoder-master/bin/moses -f /home/saj/g2p/working/binarised-model/moses.ini TWONEIGHT

/home/saj/g2p/mosesdecoder-master/bin/moses 'TWONEIGH T' -f /home/saj/g2p/working/binarised-model/moses.ini

/home/saj/g2p/mosesdecoder-master/bin/moses TWONEIGHT -f /home/saj/g2p/working/binarised-model/moses.ini

请建议正确的命令以在没有回声的情况下运行。

0 投票
2 回答
1017 浏览

linux - Moses 的语料库文件格式

我正在使用 Moses 制作语言模型。

我按照此链接中的说明进行操作:基线系统:Moses

我有 google 1-gram 文件,看起来像:

这意味着“of”这个词出现了 12,765,289,150 次。

现在我想从这个文件中创建一个语言模型(“构建语言模型”),

我不知道这种文件格式是否适用于 Moses。

在本教程中,他们正在使用“europarl-v6.en”,但我无法在网上找到它来检查文件格式。

最后编辑:

我需要将每个字母表示为单词,因此“hello”变成了“hell o”。

在按照我所说的表示每个单词之后,我应该使用哪种格式?

应该是:

或者像原来的格式:

或者也许是其他格式?

它仍然算作 google n-gram 吗?

我点击了链接:如何使用 Google Web N-gram corpus to build an LM as @ MukundKRoy 建议,但我不知道如何在我的情况下使用它(1-gram,2-gram ...my新文件不是 const)。

如果有人能告诉我这个文件应该是什么格式以便尽可能简单地与 SRILM 一起使用,我会很高兴。谢谢

0 投票
1 回答
571 浏览

g++ - giza stream.h 错误致命

从这里安装 Giza 时:

解压缩并运行“make”后,出现以下错误:

任何人都知道我该如何解决这个问题?