tensorflow - Tensorflow 在学习嵌入时限制批量大小

Question

我正在尝试学习 HMM 产生的一系列状态的状态嵌入，类似于 tensorflow Vector Representation of Words如何为文本序列执行此操作。

我的问题是这个 HMM 的“词汇”只有 12 个不同的状态。当我使用比这个词汇量大的批次运行我的代码时，Tensorflow 似乎不喜欢它。例如，尝试以 14 的批大小对其进行训练会产生错误：

F tensorflow/core/kernels/range_sampler.cc:86] Check failed: batch_size + avoided_values.size() <= range_ (14 vs. 12)
Abort trap: 6

这次检查背后的动机是什么？

score 6 · Accepted Answer

如果您按照教程中的示例进行操作

当您设置num_sampled > len(vocabulary)

num_sampled = 64    # Number of negative examples to sample.

您确实不能在词汇表大小之外对索引进行采样（对于 word 到 vec 中的负面示例）

1 回答 1