问题标签 [machine-translation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1077 浏览

nlp - 从两个句子对齐的文本构建字典?

我有一个文本语料库,它已经通过构造在句子级别对齐 - 它是一对英语字符串及其翻译成另一种语言的列表。我有大约 10 000 个字符串,每个字符串 5 到 20 个单词及其翻译。我的目标是尝试建立一个翻译质量的衡量标准——当然是自动的,因为我正在处理我一无所知的语言:)

我想从这个翻译列表中构建一个字典,它将源英语字符串中的每个单词(最可能的)翻译成另一种语言。我知道这本词典远非完美,但我希望当一个词的翻译不一致时,我能有足够好的东西来标记,例如,如果我的词典说“Store”要由“Magasin”翻译成法语那么如果我发现某个地方“商店”被翻译为“精品店”,我就会怀疑有什么问题。

所以我需要:

  1. 从我的语料库构建字典
  2. 对齐字符串/翻译对中的单词

您对如何执行此操作有很好的参考吗?已知算法?我发现了许多关于文本对齐的链接,但它们似乎更多的是在句子级别而不是在单词级别......

任何其他关于如何自动检查翻译是否一致的建议将不胜感激!

提前致谢。

0 投票
1 回答
259 浏览

c++ - C++ - 运行摩西解码器时区域设置名称无效异常

按照此处描述的步骤,我已经在我的机器(Windows 7 64 位)上成功编译了 Moses(v0.91)。但是,当我第一次尝试通过在 cygwin 中运行此命令来运行它时:

发生以下异常:

有人知道我做错了什么吗?

0 投票
1 回答
13798 浏览

java - 开源语言翻译 A​​PI - 用于 Java 应用程序

谁能推荐一个好的开源语言翻译器,可以用于从英语翻译成西班牙语/德语?

我期待一个可靠的 API 来翻译我的应用程序中的标签和消息,我可以轻松实现。请建议!

0 投票
2 回答
376 浏览

api - 如何使用 Translate 扩展通过 api 编写翻译后的 MediaWiki 文章?

我使用依赖于WikiMate的自编程 PHP 脚本通过其 API 将数百篇文章写入 MediaWiki(版本 1.20.2)。目前,这些文章只用英文写成。但是我想使用Translate 扩展来翻译它们,所以我必须批准每篇文章进行翻译。

对于每篇文章,已经有一个英文和一个法文文档,那么是否有任何自动化方法可以使用 API 一次以英文(默认)和翻译文章(法文)编写文章?翻译应该与翻译扩展兼容。

0 投票
1 回答
163 浏览

ios - iPad 普通话翻译 API

我想在我的 iPad 应用程序中实现普通话翻译功能,有没有我可以使用的免费 API,或者任何其他方式来做到这一点..

0 投票
1 回答
807 浏览

machine-translation - 语言翻译库

我想将英语翻译成法语,所以我需要使用一些离线翻译机制而不是在线翻译。那么任何人都可以为开源的语言翻译库提供有价值的信息吗?

0 投票
1 回答
3733 浏览

machine-translation - 从英语到卡纳达语的语言翻译

我想开发一个翻译器,它以英文文本作为输入并以卡纳达语(卡纳塔克邦的区域语言)输出。我想知道使用哪种编程语言进行编码。这样的翻译人员已经存在了吗?

0 投票
2 回答
1706 浏览

python - Python中的日语数字到阿拉伯数字的转换器

Python中有一个开源库可以将汉字数字转换为阿拉伯数字吗?

输入:10亿2千9百万
输出:1,029,000,000

输入:1亿6,717万2,600
输出:167,172,600

输入:3,139 百万
输出:3,139,000,000

日本数字系统:http ://en.wikipedia.org/wiki/Japanese_numerals

基于网络的转换器:http ://www.sljfaq.org/cgi/kanjinumbers.cgi

0 投票
2 回答
579 浏览

nlp - 如何使用 GIZA++ 解决 mkcls 占用大量内存和时间进行字对齐的问题?

我正在使用GIZA++来对齐来自Europarl corpus的 bitexts 中的单词。

在我使用 训练对齐模型之前GIZA++,我需要使用mkcls脚本来制作隐马尔可夫模型算法所需的类,如下所示:

我已经尝试过使用小型 1000 行语料库,它可以正常工作并在几分钟内完成。现在我正在用 1,500,000 行的语料库上尝试它,它占用了我的一个 CPU 的 100%(Six-Core AMD Opteron(tm) Processor 2431 × 12)

在上课之前,我已经采取了必要的步骤来标记化,降低所有大写字母并过滤掉超过 40 个单词的行。

有人mkcls对 GIZA++ 有类似的经验吗?它是如何解决的?如果有人在 Europarl 语料库上做过同样的事情,那么您运行mkcls.

0 投票
6 回答
1125 浏览

php - 网站翻译

我正在用 2 种语言开发一个网站。

一种选择是我们可以自己翻译,但这可能需要更多的开发时间。

所以我正在寻找一个插件。

我尝试了Microsoft Translator Widgetgoogle translate gadget ,但两者都不适用于完整的网站。用户必须在网站的每个页面上选择他们的语言。任何其他插件都可以翻译整个网站。我读了很多线程,例如 link1 link2。注意帮助了我。

请建议。