我正在阅读 Elements of Statistical Learning ESLII,在第 2 章中,他们有一个高斯混合数据集来说明一些学习算法。为了生成这个数据集,他们首先从二元高斯分布 N((1,0)', I) 中生成 10 个均值。我不确定它们是什么意思?
如何从具有均值(1,0)的二元分布中生成 10 个均值?
我正在阅读 Elements of Statistical Learning ESLII,在第 2 章中,他们有一个高斯混合数据集来说明一些学习算法。为了生成这个数据集,他们首先从二元高斯分布 N((1,0)', I) 中生成 10 个均值。我不确定它们是什么意思?
如何从具有均值(1,0)的二元分布中生成 10 个均值?
从二元高斯分布生成的每个均值都是简单的单点,其采样方式与可以从该分布生成的任何其他随机点完全相同。他们使用这些生成的点作为新分布的手段这一事实是无关紧要的。
假设然后使用 10 个均值中的每一个来构造一个新的二元高斯。
表示 ~ N( (1,0), I)
其中~表示从分布中提取的值。由于在这种情况下采样的分布是二元高斯分布,因此采样的每个数据点都是二维点 (x1, y1)。
然后可以使用从原始分布中采样的每个点来进行新的分布。
例子:
means = [ (x1,y1), (x2,y2), ..., (x10,y10) ]
构建新的二元高斯函数:
N1((x1,x2), I), N2((x2,y2), I), ..., N10((x10,y10), I)
他们只是使用初始双变量高斯分布 N((1,0), I) 作为一种简单的方法来选择 10 个正态分布的随机均值。