“language-model”的相关标签问题

0 投票

2 回答

2156 浏览

tensorflow - 使用 TensorFlow 的 RNN (LSTM) 语言模型获取给定序列的下一个单词的概率分布？

我在这里运行 TensorFlow 的 RNN (LSTM) 语言模型示例。它完美地运行并报告了困惑。

我想要的是三件事：

给定一个序列（例如 w1 w5 w2000 w750），给出词汇表中下一个单词的概率分布。我不知道如何使用教程中的模型来做到这一点。
我希望模型返回最可能的序列（例如 n-gram）的排名，n 可以作为输入给出。

和

给定一个序列，我想要它的概率。

我是 TensorFlow 和 RNN 的新手，所以请告诉我您是否需要比我提供的更多信息。

语言模型的代码在这里。

2016-08-31T06:47:53.943

0 投票

1 回答

104 浏览

neural-network - Tensorflow：循环神经网络训练对和对损失函数的影响

我正在查看 RNN 语言模型的代码。我对1）如何构造训练对（x，y）以及随后2）如何计算损失感到困惑。该代码借鉴了 Tensorflow RNN 教程（阅读器模块）。

在阅读器模块中，定义了一个生成器ptb_iterator。它将数据作为一个序列接收，并根据批量大小和您希望“展开”RNN 的步骤数产生x,y 对。最好先查看整个定义，但让我感到困惑的部分是：

记录为：

因此，如果理解正确，对于数据序列[1 2 3 4 5 6]，num_steps = 2然后对于随机梯度下降（即 batch_size=1），将生成以下对：

x=[1,2] , y=[2,3]
x=[3,4] , y=[5,6]

1）这是正确的方法吗？如果不这样做，那么对是：

x=[1,2] , y=[2,3]
x=[2,3] , y=[3,4] ... # 允许更多数据点

或者

x=[1,2] , y=[3]
x=[2,3] , y=[4] ... # 确保所有预测都使用上下文长度 = num_steps

2）最后，考虑到这些对是在阅读器模块中生成的，当涉及到训练时，计算的损失会不会反映 RNN 在一系列展开步骤而不是num_steps指定范围内的性能？

例如，模型将预测 x=3（来自 x=[3,4]）而不考虑 2 在它之前（即展开 RNN 一步而不是两步）。

neural-network tensorflow recurrent-neural-network language-model

2016-09-07T15:27:51.080

0 投票

1 回答

646 浏览

python - 当我使用 Keras+Theano 将序列拟合到序列 LSTM 时引发 MemoryError

我试图实现一个序列到序列的语言模型。在训练过程中，模型将 GloVe 生成的 50d 个词向量序列，输出 1-to-V（V 是词汇量的大小）向量表示下一个词，因此可以看作下一个词对应的分布到测试过程中当前时间步的输入词向量，我尝试了一个 112 词的词汇表。

然后，我构建了两个模型，如下所示：

当我试图通过

第一个模型model1崩溃并引发 MemoryError，但第二个模型model2正常完成。X 的形状为(number_of_sentences, max_words_in_one_sentence, 50)，Y 的形状为(number_of_sentences, max_words_in_one_sentence, 112)。在这个例子中，number_of_sentences=10000, max_words_in_one_sentence=13。

我想知道当我将一个新的时间分布密集附加到 LSTM 层时发生了什么，以及哪个是我想要实现我的语言模型的模型。

python keras lstm language-model

2016-09-08T11:21:00.797

0 投票

1 回答

80 浏览

python - N-grams - not in memory

I have 3 milion abstracts and I would like to extract 4-grams from them. I want to build a language model so I need to find the frequencies of these 4-grams.

My problem is that I can't extract all these 4-grams in memory. How can I implement a system that it can estimate all frequencies for these 4-grams?

python n-gram language-model

2016-09-21T10:09:33.150

0 投票

1 回答

2331 浏览