3

我正在尝试学习 HMM 产生的一系列状态的状态嵌入,类似于 tensorflow Vector Representation of Words如何为文本序列执行此操作。

我的问题是这个 HMM 的“词汇”只有 12 个不同的状态。当我使用比这个词汇量大的批次运行我的代码时,Tensorflow 似乎不喜欢它。例如,尝试以 14 的批大小对其进行训练会产生错误:

F tensorflow/core/kernels/range_sampler.cc:86] Check failed: batch_size + avoided_values.size() <= range_ (14 vs. 12)
Abort trap: 6

这次检查背后的动机是什么?

4

1 回答 1

6

如果您按照教程 中的示例进行操作

当您设置num_sampled > len(vocabulary)

num_sampled = 64    # Number of negative examples to sample.

您确实不能在词汇表大小之外对索引进行采样(对于 word 到 vec 中的负面示例)

于 2016-05-03T20:52:33.527 回答