-2

我正在尝试计算P(A=a|B=b,C=c)where ais an element in ['high', 'medium', 'low'], b is an element in['0-20', '20-40', '40-60', '60-80', '80-inf']并且cis an element in的条件概率['male', 'female']

我有一本字典,其频率如下:

{('high', '0-20', 'female'): 11,
 ('high', '0-20', 'male'): 43,
 ('high', '20-40', 'female'): 10,
 ('high', '20-40', 'male'): 17,
 ('high', '40-60', 'female'): 11,
 ('high', '40-60', 'male'): 10,
 ('high', '60-80', 'female'): 2,
 ('high', '60-80', 'male'): 1,
 ('high', '80-inf', 'female'): 0,
 ('high', '80-inf', 'male'): 0,
 ('low', '0-20', 'female'): 130,
 ('low', '0-20', 'male'): 159,
 ('low', '20-40', 'female'): 186,
 ('low', '20-40', 'male'): 297,
 ('low', '40-60', 'female'): 71,
 ('low', '40-60', 'male'): 144,
 ('low', '60-80', 'female'): 35,
 ('low', '60-80', 'male'): 53,
 ('low', '80-inf', 'female'): 1,
 ('low', '80-inf', 'male'): 2,
 ('medium', '0-20', 'female'): 90,
 ('medium', '0-20', 'male'): 194,
 ('medium', '20-40', 'female'): 72,
 ('medium', '20-40', 'male'): 116,
 ('medium', '40-60', 'female'): 46,
 ('medium', '40-60', 'male'): 49,
 ('medium', '60-80', 'female'): 12,
 ('medium', '60-80', 'male'): 22,
 ('medium', '80-inf', 'female'): 1,
 ('medium', '80-inf', 'male'): 2}

我想要的是一个看起来像这样的字典:

{('high', '0-20', 'female'): P(A='high'| B='0-20', C='female'),
 etc...,
}
4

1 回答 1

0

因此,如果我正确理解您的评论,那么您遇到的问题是当有两个或多个“条件”而不是单个条件时计算条件概率的概念。

自从我上次参加概率/统计课程以来已经有一段时间了,但我认为您需要做的就是将其分解为单独的问题。从数据中,您可以轻松计算出您的P(B=b)P(C=c)。接下来您需要的是B=bAND的联合概率C=c,您也应该能够直接从数据中获得 - 例如P(high, 0-20),它只是与这两个条件匹配的所有点的总和除以总数。如果将此称为联合概率P(X),那么从条件概率的定义中计算 P(A=a|X) = P(A=a ∩ X) / P(X) 应该是相当简单的。

不过,将其重新发布或将其迁移到 Math SE 站点可能是一个好主意,以获得确认和/或更好的答案......

于 2015-01-06T18:28:40.647 回答