问题标签 [opennmt]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
deep-learning - 在 OpenNMT-py 中的翻译过程中获得对齐/注意
有谁知道在 Opennmt-py 中翻译时如何获得对齐权重?通常唯一的输出是结果句子,我试图找到一个调试标志或类似的注意力权重。到目前为止,我一直没有成功。
machine-learning - 获取在 OpenNMT-py 中训练的模型的梯度
当使用 OpenNMT-py 训练模型时,我们得到一个 dict 作为输出,其中包含网络的权重和偏差。但是,这些张量具有 requires_grad = False,因此没有梯度。例如。对于一层,我们可能有以下张量,表示编码器和解码器中的嵌入以及权重和偏差。它们都没有渐变属性。
编码器.embeddings.emb_luts.0.weight
解码器.embeddings.emb_luts.0.weight
编码器.rnn.weight_ih_l0
编码器.rnn.weight_hh_l0
编码器.rnn.bias_ih_l0
编码器.rnn.bias_hh_l0
解码器.rnn.layers.0.weight_ih
解码器.rnn.layers.0.weight_hh
解码器.rnn.layers.0.bias_ih
解码器.rnn.layers.0.bias_hh
OpenNMT-py 是否可以设置 requires_gradient = True 并使用一些我没有找到的选项,或者是否有其他方法可以获得这些张量的梯度?
deep-learning - 在 OpenNMT-py 中输出隐藏状态
我只是有一个关于 OpenNMT 的 pytorch 版本的简短问题。选项中似乎没有返回编码器和解码器隐藏状态的选项。我错过了一个标志还是这不是 OpenNMT-py 中的一个选项?
python - NeuroX,ValueError:格式错误的十六进制 UUID 字符串
现在这可能是一个长镜头,但我对某个名为 NeuroX 的烧瓶应用程序有疑问,https://github.com/fdalvi/NeuroX。这是一个用于分析神经网络的烧瓶应用程序。细节并不那么重要,但您运行应用程序并输入模型和文本文件的路径。尝试运行该应用程序时,我收到以下错误。
由于我不希望任何人经历这个,我的问题很简单,有没有人知道是什么原因造成的?是因为我运行的是 Ubuntu 吗?
python - 在 opennmt-py 中获取注意力权重
特别是在 opennmt-py 中。现在有很多关于这个主题的问题,例如在 OpenNMT-py 中的翻译过程中获取对齐/注意以及 opennmt 论坛上的以下主题https://github.com/OpenNMT/OpenNMT-py/issues/575。我使用后者建议的代码。然而,似乎没有人能解决我遇到的问题。我尝试运行以下简单的代码片段。
我得到这个错误跟踪。
那么有没有人经历过并解决了这个问题?或者知道去哪里看?我猜这与加载的文件有关,但它是用 opennmt-py 以相当标准的方式训练的。
python-2.7 - 如何为 OpenNMT-py (pytorch) 提供多 GPU 支持?
我使用 python-2.7 版本来运行支持 GPU 的 PyTorch。我使用此命令使用多 GPU 训练数据集。有人可以告诉我如何在 OpenNMT-py 中使用 PyTorch 修复此错误,或者有没有办法使用 python 2.7 为多 GPU 提供 pytorch 支持?
这是我尝试过的命令。
CUDA_VISIBLE_DEVICES=1,2 python train.py -data data/demo -save_model demo-model -world_size 2 -gpu_ranks 0 1
这是错误:
回溯(最后一次调用):文件“train.py”,第 200 行,在 main(opt) 文件“train.py”,第 60 行,在 main mp = torch.multiprocessing.get_context('spawn') AttributeError: '模块'对象没有属性'get_context'
docker - Tensorflow Serving - 未找到:操作类型未注册“GatherTree”
我只是一个新手。在这种情况下,我在提供 tensorflow 模型时遇到问题:
I. 使用这个http://opennmt.net/OpenNMT-tf/quickstart.html来训练模型。
二、通过以下步骤为模型提供服务:
- 使用以下命令创建 docker 映像:
docker build --pull -t $USER/tensorflow-serving-devel -f tensorflow_serving/tools/docker/Dockerfile.devel .
- 运行 docker 容器:
docker run --name=tf_container -it $USER/tensorflow-serving-devel
- 服务模型:
tensorflow_model_server --port=9000 --model_name=model_name --model_base_path=/model_file &> result_log &
三、result_log文件内容:
java - 在android代码上执行model.forward时应用程序崩溃,我不知道为什么?
当我在与我的应用程序重新启动对应的行处精确执行此代码时module.forward
。下面附上代码:
python - 为 OpenNMT 安装 PyTorch 时遇到问题
我正在尝试使用此处的说明训练 openNMT 模型 - https://pypi.org/project/OpenNMT-py/
python setup.py install
但是我在安装(使用)时遇到了问题
它遇到错误 -
我尝试手动安装 - python -m pip install torch==1.4.0
(因为之前的链接说 1.4.0 是唯一受支持的,但它不起作用。(说没有找到 torch==1.4.0 的匹配分布)
python - 如何在 opemnmt-py 中将字符串转换为路径
我将 opennmt-py 用于 MT,并且在任何时候我想设置路径时都在代码中使用我必须编写所有目录的路径,而且当我有长目录时它看起来并不好看。有没有办法将字符串设置为主目录,只需将文件名添加到末尾。我使用google colab训练模型 代码如下:
和我想要的代码:
或者也许可以将所有路径写入变量并像这样使用它: