问题标签 [perplexity]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
21 浏览

keras - 如何比较 BiLSTM 和 N-Gram 语言模型的性能?

评估语言模型的流行方法是困惑。

但是我们不能直接从 BiLSTM 模型中找到困惑数。

我们需要从 2^(cross-entropy) 计算它。

我应该使用 BLEU 还是 Next-word 预测结果或其他方法来评估这些模型?

我会很感激任何想法。

0 投票
0 回答
75 浏览

python - 如何使用 Tensorflow 的 PTB 模型示例中的训练模型计算困惑度?

在使用示例中的 PTB 模型期间,我遇到了一些问题。
在示例中,作者使用以下方式获取测试困惑度:

但是通过代码,我只能在训练后立即获得测试困惑。如何加载一个训练好的模型并计算相应生成文本的困惑度?
当我试图从生成的文本中计算困惑时,我使用了以下代码:

但我得到了与前一种方式不同的结果。
问题出在哪里?
谢谢阅读。

0 投票
0 回答
33 浏览

r - R 中带有 textmodel_seedLDA 包的 LDA 主题模型的诊断(困惑、LogLik 等)

我正在使用这个seededLDA包来做一个 LDA 主题模型。但是,我发现用于计算困惑度、对数似然度、排他性等(以及其他诊断工具)的所有包和函数都不适用于这些模型(它们仅适用于topicmodelsLDA 输出)。

我没有使用topicmodels,因为我需要使用种子词,并且我无法让播种功能发挥topicmodels作用。

我真的很喜欢的外观,topicdoc但仅适用于topicmodels. 那么,有谁知道如何:

  • 将输出转换textmodeltopicmodels; 或者
  • textmodel输出进行诊断?

在此先感谢,丹尼尔

0 投票
0 回答
13 浏览

python-3.x - 我想测量 pretrained_model 的困惑度

我想测量 pretrained_model 的困惑度。这个 pretrained_model 是 self_made。代码如下。

模型内容如下。

错误IndexError: index out of range in selfoutputs = model(inputs, masked_lm_labels=labels) # tuple

输入和标签形状都是 torch.Size([128, 128]),这有什么问题?

有人可以告诉我该怎么做吗?如果我遗漏了什么,请指出。