1

假设我有一个(x, y)成对的训练集,其中x是输入示例,y是相应的目标,y是一个值(1 ... k)k是类数)。

在计算训练集的似然度时,是否应该针对整个训练集(所有的例子)进行计算,即:

L = P(y | x) = p(y1 | x1) * p(y2 | x2) * ...

或者是针对特定训练示例计算的可能性(x, y)

我之所以问,是因为我看到了这些讲义(第 2 页),他似乎在其中计算 L_i,这是每个训练示例分别进行的可能性。

4

1 回答 1

3

似然函数描述了在给定一些参数的情况下生成一组训练数据的概率,并且可以用来找到那些以最大概率生成训练数据的参数。您可以为训练数据的子集创建似然函数,但这并不代表整个数据的可能性。但是,您可以做的(以及在讲义中显然默默地做的事情)是假设您的数据是独立且同分布的 (iid)。因此,您可以将联合概率函数拆分为更小的部分,即p(x|theta) = p(x1|theta) * p(x2|theta) * ...(基于独立性假设),并且您可以对这些部分中的每一个使用具有相同参数(theta)的相同函数,例如正态分布(基于相同性假设)。然后,您可以使用对数将乘积转换为总和,即p(x|theta) = p(x1|theta) + p(x2|theta) + ...。该函数可以通过将其导数设置为零来最大化。得到的最大值是以最大概率创建您的 x 的 theta,即您的最大似然估计量。

于 2015-06-04T11:38:31.403 回答