问题标签 [machine-translation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 从两个句子对齐的文本构建字典?
我有一个文本语料库,它已经通过构造在句子级别对齐 - 它是一对英语字符串及其翻译成另一种语言的列表。我有大约 10 000 个字符串,每个字符串 5 到 20 个单词及其翻译。我的目标是尝试建立一个翻译质量的衡量标准——当然是自动的,因为我正在处理我一无所知的语言:)
我想从这个翻译列表中构建一个字典,它将源英语字符串中的每个单词(最可能的)翻译成另一种语言。我知道这本词典远非完美,但我希望当一个词的翻译不一致时,我能有足够好的东西来标记,例如,如果我的词典说“Store”要由“Magasin”翻译成法语那么如果我发现某个地方“商店”被翻译为“精品店”,我就会怀疑有什么问题。
所以我需要:
- 从我的语料库构建字典
- 对齐字符串/翻译对中的单词
您对如何执行此操作有很好的参考吗?已知算法?我发现了许多关于文本对齐的链接,但它们似乎更多的是在句子级别而不是在单词级别......
任何其他关于如何自动检查翻译是否一致的建议将不胜感激!
提前致谢。
c++ - C++ - 运行摩西解码器时区域设置名称无效异常
按照此处描述的步骤,我已经在我的机器(Windows 7 64 位)上成功编译了 Moses(v0.91)。但是,当我第一次尝试通过在 cygwin 中运行此命令来运行它时:
发生以下异常:
有人知道我做错了什么吗?
java - 开源语言翻译 API - 用于 Java 应用程序
谁能推荐一个好的开源语言翻译器,可以用于从英语翻译成西班牙语/德语?
我期待一个可靠的 API 来翻译我的应用程序中的标签和消息,我可以轻松实现。请建议!
api - 如何使用 Translate 扩展通过 api 编写翻译后的 MediaWiki 文章?
我使用依赖于WikiMate的自编程 PHP 脚本通过其 API 将数百篇文章写入 MediaWiki(版本 1.20.2)。目前,这些文章只用英文写成。但是我想使用Translate 扩展来翻译它们,所以我必须批准每篇文章进行翻译。
对于每篇文章,已经有一个英文和一个法文文档,那么是否有任何自动化方法可以使用 API 一次以英文(默认)和翻译文章(法文)编写文章?翻译应该与翻译扩展兼容。
ios - iPad 普通话翻译 API
我想在我的 iPad 应用程序中实现普通话翻译功能,有没有我可以使用的免费 API,或者任何其他方式来做到这一点..
machine-translation - 语言翻译库
我想将英语翻译成法语,所以我需要使用一些离线翻译机制而不是在线翻译。那么任何人都可以为开源的语言翻译库提供有价值的信息吗?
machine-translation - 从英语到卡纳达语的语言翻译
我想开发一个翻译器,它以英文文本作为输入并以卡纳达语(卡纳塔克邦的区域语言)输出。我想知道使用哪种编程语言进行编码。这样的翻译人员已经存在了吗?
python - Python中的日语数字到阿拉伯数字的转换器
Python中有一个开源库可以将汉字数字转换为阿拉伯数字吗?
输入:10亿2千9百万
输出:1,029,000,000
输入:1亿6,717万2,600
输出:167,172,600
输入:3,139 百万
输出:3,139,000,000
nlp - 如何使用 GIZA++ 解决 mkcls 占用大量内存和时间进行字对齐的问题?
我正在使用GIZA++来对齐来自Europarl corpus的 bitexts 中的单词。
在我使用 训练对齐模型之前GIZA++
,我需要使用mkcls脚本来制作隐马尔可夫模型算法所需的类,如下所示:
我已经尝试过使用小型 1000 行语料库,它可以正常工作并在几分钟内完成。现在我正在用 1,500,000 行的语料库上尝试它,它占用了我的一个 CPU 的 100%(Six-Core AMD Opteron(tm) Processor 2431 × 12)
在上课之前,我已经采取了必要的步骤来标记化,降低所有大写字母并过滤掉超过 40 个单词的行。
有人mkcls
对 GIZA++ 有类似的经验吗?它是如何解决的?如果有人在 Europarl 语料库上做过同样的事情,那么您运行mkcls
.
php - 网站翻译
我正在用 2 种语言开发一个网站。
一种选择是我们可以自己翻译,但这可能需要更多的开发时间。
所以我正在寻找一个插件。
我尝试了Microsoft Translator Widget和google translate gadget ,但两者都不适用于完整的网站。用户必须在网站的每个页面上选择他们的语言。任何其他插件都可以翻译整个网站。我读了很多线程,例如 link1 link2。注意帮助了我。
请建议。