“seq2seq”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

278 浏览

python - tf.gather 在使用自定义 softmax_loss 函数时超出范围，即使它不应该

我在内部使用一个小的自定义函数tf.contrib.seq2seq.sequence_loss(softmax_loss_function=[...])作为自定义 sofmax_loss_function：

但即使标签和 logits 应该具有相同的维度，执行后它会返回 and InvalidArgumentError：

indices[1500,1] = 2158 is not in [0, 1600)由于我的随机种子，数字会有所不同。

tf.gather有没有我可以使用的其他功能？或者返回的值是假的？

如果我通过通常的 Tensorflow 函数，一切正常。

提前致谢！

2019-03-13T16:37:26.763

0 投票

0 回答

334 浏览

java - Seq2Seq 模型 (DL4J) 做出荒谬的预测

我正在尝试在 DL4J 中实现 Seq2Seq 预测器模型。我最终想要的是使用数据点的时间序列来使用这种类型的模型INPUT_SIZE来预测以下数据点的时间序列。OUTPUT_SIZE每个数据点都有numFeatures特征。现在，DL4J 有一些示例代码来解释如何实现一个非常基本的 Seq2Seq 模型。我在将他们的例子扩展到我自己的需要方面取得了一些进展；下面的模型可以编译，但它所做的预测是荒谬的。

我构建输入/标记数据的方式是将输入数据拆分为第一个INPUT_SIZE - 1时间序列观察（对应in_data于 ComputationGraph 中的输入）和最后一个时间序列观察（对应于lastIn输入）。标签是未来的一个时间步长；为了做出预测，我只需调用net.output() OUTPUT_SIZE时间来获得我想要的所有预测。为了更好地看到这一点，这就是我初始化输入/标签的方式：

我相信我的错误来自我的计算图架构中的错误，而不是我如何准备数据/进行预测/其他东西，因为我已经完成了其他具有更简单架构的小型项目并且没有任何问题。

我的数据被归一化为均值 0 和标准值。偏差为 1。因此，大多数条目应该在 0 左右，但是，我得到的大多数预测都是绝对值远大于零的值（大约 10s-100s）。这显然是不正确的。我已经为此工作了一段时间，但一直无法找到问题；任何有关如何解决此问题的建议将不胜感激。

我使用的其他资源：示例 Seq2Seq 模型可以在这里找到，从第 88 行开始。计算图文档可以在这里找到；我已经广泛阅读了这篇文章，看看我是否能找到一个无济于事的错误。

java machine-learning seq2seq dl4j computation-graph

2019-03-28T04:03:29.897

0 投票

1 回答

530 浏览

python - keras lstm-seq2seq-聊天机器人。训练不起作用并预测出一些错误。无论我输入什么，我都会得到相同的答复

我已经构建了一个基于聊天机器人的 seq2seq。我使用的 coupus 是来自https://github.com/Conchylicultor/DeepQA/tree/master/data/cornell的电影对话我用来训练我的模型的大约 20000 个语料库。在 300 个 epoch 之后，损失约为 0.02。但最后当我输入一个随机问题时，比如“你要去哪里？” 或“你叫什么名字”或其他什么，我得到了相同的答案“它”。如您所见，无论我输入什么，我总是得到一个单词“It”。我发现当我使用 np.argmax 计算预测的概率分布时，每次我得到相同的索引“4”，这意味着接下来的单词' 指数。

我还发现来自 encoder_model 预测的 state_h 和 state_c 有一些非正规数据。例如。来自状态 c 的最大概率 > 16。

我的输入：你叫什么名字？['什么'，'是'，'你的'，'名字'，'？'] [[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 218 85 20 206 22]]

我得到了什么：它

python keras lstm recurrent-neural-network seq2seq

2019-04-02T15:02:12.620

0 投票

0 回答

151 浏览