问题标签 [moses]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
macos - 编译摩西时出错。没有 dist 文件夹或 moses.ini 文件
我是一个初学者程序员,所以我仍在努力掌握一些东西。请温柔一点。
我正在尝试在 OS X 上安装和编译 Moses( http://www.statmt.org/moses/?n=Development.GetStarted ),但遇到了很多问题。
我一直按照这个网站(http://www.statmt.org/moses_steps.html)的说明进行操作,一切顺利,直到我真正编译了摩西。我正在使用以下代码:
这应该在 dist/bin/ 中创建几个文件,包括 moses.ini 解码器本身。但是, dist/bin/ 文件夹根本没有出现。在 Moses 编译过程中,我没有看到任何错误——在我真正检查文件并尝试运行 Moses 之前,一切似乎都很顺利。
当我尝试运行测试时,我使用以下内容:
我收到错误:没有这样的文件或目录。
有谁知道我可能做错了什么?任何和所有的建议将不胜感激。
谢谢!
perl - moses-SMT 系统中的分词器即使使用 10 个句子也卡住了
我试图制作一个基线 MT 系统。只是为了检查它是如何工作的,我制作了只有 2000 个句子的源 (S) 和目标 (T) 语言语料库。第一步是为机器翻译 (MT) 系统准备数据。在这一步中,我们首先必须执行Baseline SMT中提到的标记化。我用过这段代码:
(说 S = 法语 & T = 英语)
2小时后我检查它仍在运行。我很好奇,因为它没有预料到。然后我只用了十句话。令我惊讶的是,已经 30 分钟了,它仍在运行。
我做错什么了吗?
PS:OS = Ubuntu 14.04.5 LTS Sony ultrabook 没有双启动。
regex - ($pre =~ /\./ && $pre =~ /\p{IsAlpha}/) 在 Moses Tokenizer 中是什么意思?
Moses Tokenizer是机器翻译和自然语言处理实验中广泛使用的分词器。
有一行正则表达式检查:
如果我错了请纠正我,第二和第三个条件是检查
- 前缀是否在不间断前缀列表中
- 该单词是否不是最后一个标记,并且仍然有一个小写标记作为下一个单词。
问题在于它检查的第一个条件:
检查前缀是否是
$pre =~ /\./
单个句号?并且正在
$pre =~ /\p{IsAlpha}/
检查前缀是否是perluniprop中字母列表中的字母?一个相关的问题是句号是否已经在 perluniprop 字母表中?如果是这样,这个条件不是永远不会成立吗?
moses - moses 错误:无法读取 /phrase-model/moses.ini
我刚刚安装 moses 2.1 ,在尝试示例模型时出现错误:无法读取 /phrase-model/moses.ini
我发送的命令是 echo 'das ist ein kleines haus' | /Users/kagrawal/Desktop/tools/moses/bin/moses -f /phrase-model/moses.ini <phrase-model/in > 从我的示例模型文件夹中出来。
moses - 如何将摩西解码器翻译写入文件?
我正在尝试测试摩西解码器。我有大量数据,我需要将它们的翻译记录到一个文件中。我的意思是把所有的数据都给摩西,然后把翻译记录到一个文件中。有谁能帮助我吗?我使用了这个链接:http ://www.statmt.org/moses/?n= Moses.Baseline 现在我可以给它一个句子以便翻译。谢谢!
machine-translation - giza++ 短语表中的计数是什么意思?
我一直在官方网站(和 pdf 手册)中搜索 giza++ 短语表输出中数字的含义:http: //www.statmt.org/moses/? n=FactoredTraining.ScorePhrases
这就是我想出的。
假设这是短语表中的一行
这意味着:
这些都很有道理。
然而,如果我使用文本编辑器进行文本搜索,我会得到:
即,完全不同的数字。
另一个奇怪的地方是:
所以,考虑到官网的解释,
和
一种解释可能是它可能正好相反。
但是,实际计数(“the”)是 21466。
是否有其他一些教程/手册可以更好地阐明 giza++ 输出文件的内容?
xml - 使用 xml-rpc 调用 Moses 作为服务的翻译方法失败
我正面临一个异常调用 moses(统计机器翻译)作为安装了 xmlrpc 的服务。我首先打开了一个到摩西服务器的端口
但主要问题是当我发送一个带有 xml 作为正文参数的休息请求时。
当我在http://xxx.xxx.xxx.xxx:8082/RPC2上将其作为 POST 请求执行时
我注意到端口上的服务失败并出现异常“在抛出 'xmlrpc_c::fault' Aborted 的实例后调用终止”
我认为主要问题在于 xml 正文结构,但我在网上找不到任何有关翻译方法的文档。有什么建议么?谢谢你。
更新
请注意,如果我打开一个带有设置的端口
我从来没有得到回应。
python - perl 正则表达式之间的区别在摩西的两个数字之间添加点
上下文,我正在尝试将 Perl 代码从https://github.com/moses-smt/mosesdecoder/blob/master/scripts/tokenizer/normalize-punctuation.perl#L87移植到 Python 中,这里有这个正则表达式珀尔:
如果我在给定输入 text 的 Perl 脚本中尝试它123 45
,它会返回带有点的相同字符串。作为健全性检查,我也在命令行上尝试过:
[出去]:
当我将正则表达式转换为 Python 时也是如此,
但是当我使用摩西脚本时:
即使我们尝试在摩西代码中的正则表达式之前和之后打印字符串,即
[出去]:
我们看到在正则表达式之前和之后,字符串没有变化。
我的部分问题是:
- Python
\g<1>.\g<2>
正则表达式是否等同于 Perl 的$1.$2
? - 为什么 Perl 正则表达式没有
.
在 Moses 的两位数组之间添加句号? - 如何在 Python 正则表达式中复制 Perl 在 Moses 中的行为?
- 如何在摩西的 Perl 正则表达式中复制 Python 的行为?