1

我正在尝试使用 Tensorflow Probability 编写代码,以使用 EM 算法对一组样本(来自多个高斯分布)进行分类。

因为我想为任何一般问题编写此代码(如果样本来自 2 个高斯分布或 8 个高斯分布,我希望它能够工作)。

我现在遇到的问题是我找不到创建数组的方法tfd.Normal

我想将它作为一个数组(或其他类似类型的数据),因为这样我可以处理不确定数量的分布。

谁能帮我解决这个问题?

下面的代码会是一个解决方案吗?

true_mu = np.array([20,60], dtype=np.float64)
true_sigma = np.array([8,4], dtype=np.float64)  
true_dist = tfd.Normal(loc=true_mu, scale=true_sigma)
4

1 回答 1

1

TFP 分发是开箱即用的批处理功能。您的代码应该可以工作,并代表 2 个正态分布的向量,其中第一个是N(X|20, 8),第二个是N(X|60, 4)

您可以通过(在这种情况下true_dist.batch_shape将返回)来查询它。[2]

您现在可以采样:(true_dist.sample()返回带有 shape 的 float64 [2])。

您可以计算概率:(true_dist.log_prob(0)返回一个 float64 形状[2],表示[log N(0|20, 8), log N(0|60, 4)])。

您可以估计每个批次成员的独立概率:(true_dist.log_prob([0, 1])返回一个float64形状[2]为 ,表示[log N(0|20, 8), log N(1|60, 4)])。

还要注意 TFP 分布广播它们的参数,所以如果你想要两个具有相同位置和不同比例的法线,你可以写tfd.Normal(0, [10, 20]).

于 2019-03-20T14:29:29.207 回答