0

大家好,

我正在写我的计算机科学硕士论文。更具体地说,我正在研究在用作统计依赖解析器中的特征时调整分布式语义模型的超参数的效果。我正在使用 word2vec,一种基于非确定性神经网络的词嵌入软件。为了能够验证我的结果,我必须量化模型中的非确定性程度。

然而,我确实认为这个问题可以在更抽象的层面上提出——我可以使用什么测试来量化统计模型中的非确定性程度?例如,当我进行五次相同的实验时,我得到以下结果:

89.5, 89.7, 89.4, 89.5, 89.9

我如何确定我的系统的“不确定性如何”并将其用作接受或丢弃未来实验结果的基础?

4

1 回答 1

2

如果通过测试您的意思是显着性或假设测试,那么这些测试是无用的,您可以忽略它们。

量化语言解析或其他任何不确定性的适当方法是将不确定性表示为概率。在语言解析的上下文中,这意味着在解析给定句子的可能方式上构建概率分布。

如果你需要做出决定,你需要提供额外的数据来表达对结果的偏好(即效用函数)。概率和效用通过所谓的预期效用假设结合起来:最好的行动是最大化预期效用的行动。

罗伯特·克莱门(Robert Clemen)的“做出艰难的决定”是对这些概念的有用介绍,并使用了许多领域的示例。更具体到您的问题,对概率语言解析的网络搜索会出现很多点击。

您可能会在 stats.stackexchange.com 上对这个问题更感兴趣。那里可能已经有相关问题的答案。

于 2017-02-26T20:14:02.940 回答