问题标签 [encoder-decoder]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
keras - 拼写校正模型中的注意力机制
我正在尝试在这段代码中测试注意力机制(基于 MajorTal 的工作):
有人可以告诉我如何用注意力机制替换这个实现的解码器吗?提前致谢。
python - np.zero() 的内存错误
带有 WTO 面板报告文本数据的解码器模型。代码如下
我正在尝试在我的远程控制计算机中运行此代码,该计算机具有 64GB 内存和两个 Titan X,但它一直返回以下错误:
有一件事很奇怪,在我没有 gpu 的普通计算机上,有 16GB 内存,它不会返回相同代码的错误。
会有什么可疑的问题?
keras - 将 initial_state 传递给 Keras 中的双向 RNN 层
我正在尝试使用双向 GRU 在 Keras 中实现编码器-解码器类型的网络。
以下代码似乎正在工作
但是当我将解码更改为使用Bidirectional
包装器时,它会停止显示encoder
并src_input
在model.summary()
. 新的解码器看起来像:
model.summary()
双向解码器的输出。
问题:当我传入解码器时initial_state
,我错过了什么吗?Bidirectional
我怎样才能解决这个问题?有没有其他方法可以使这项工作?
python - 如何在 Tensorflow 中使用动态 rnn 构建解码器?
我知道如何在 Tensorflow 中使用动态 rnn 构建编码器,但我的问题是我们如何将它用于解码器?因为在每个时间步的解码器中,我们应该提供前一个时间步的预测。提前致谢!
python - 我正在使用 rnn_decoder 并收到输入不可迭代的错误
我收到此错误并且无法修复它:
~.conda\envs\tensorflow\lib\site-packages\tensorflow\python\framework\ops.py in iter (self)
394 if context.in_graph_mode():
395 raise TypeError(
396 "Tensor
当急切执行时对象不可迭代未
启用“ 397”。要迭代此张量,请使用tf.map_fn
.")
398 shape = self._shape_tuple()TypeError:
Tensor
当未启用急切执行时,对象不可迭代。迭代这个张量使用tf.map_fn
我的代码是:
java - Base64.Decoder 返回外来字符
我正在构建一个小型应用程序,将文本文件中的文本转换为 Base64,然后恢复正常。解码后的文本总是在第一行的开头返回一些汉字。
加密()之前的文本文件之前:
起司
番茄
土豆
火腿
山药
加密后的文本文件() //5jAGgAZQBlAHMAZQANAAoAdABvAG0AYQB0AG8AZQBzAA0ACgBwAG8AdABhAHQAbwBlAHMADQAKAGgAYQBtAHMADQAKAAHkAYQBtAHMA
解密后的文本文件
뿯붿奶酪
番茄
土豆
火腿
山药
nlp - Seq2seq LSTM 无法生成合理的摘要
我正在 keras 中训练编码器-解码器 LSTM 用于文本摘要和具有以下架构的 CNN 数据集
我正在使用 skip-gram 预训练词嵌入(大小为 256)和
然后我用零填充输入序列,这样所有文章的长度都相等
我在每个摘要中放了一个 1 的向量作为“开始”标记
稍后在解码器输出中使用 MSE、RMSProp、tanh 激活
训练:20 epochs,batch_size=100,clip_norm=1,dropout=0.3,hidden_units=256,LR=0.001,训练样例=10000,validation_split=0.2
- 网络训练、训练和验证 MSE 下降到 0.005,但是在推理过程中,解码器不断重复产生一些没有意义的单词,并且与真正的摘要相去甚远。
我的问题是,我的训练方法、填充、损失函数、数据大小、训练时间是否存在根本性错误,导致网络无法泛化?
c++ - YUV420 从像素指针到 BGR 图像
我正在捕获来自 YUV420 解码器的原始输出。我得到了三个指针:分别是 Y(1920*1080)、U(960*540) 和 V(960*540)。
我想使用 OpenCV 将图像保存为 JPEG。我尝试使用 opencv 的 cvtcolor
但是,这是保存的输出图像:
有人可以建议保存图像的正确方法是什么吗?
python-3.x - PyTorch:DecoderRNN:RuntimeError:输入必须有 3 维,得到 2
我正在使用 PyTorch 构建一个 DecoderRNN(这是一个图像字幕解码器):
数据具有以下形状:
然后我收到以下错误。有什么我在这里错过的想法吗?谢谢!