我有两个分布(值集)并希望知道一个集合“适合”另一个集合的概率。像这样的东西:
dist = [355, 221, 302, ...]
values = [550, 537, 404, ...]
odds = odds_all_values_in_dist(dist,values)
我没有尝试任何东西(因为我对概率论的了解不够好)而且我几乎没有使用过 scipy。另外我不知道哪种分布可能合适,数据点是“每天的点击次数”(有点)。
编辑: dist
是上个月values
的点击次数/天,是当前月份的点击次数/天。尽管我缺乏概率论和数学知识,但希望这有助于澄清我正在努力实现的目标。:)
编辑 2:本月点击次数增加了 50%。考虑到上个月和当前月份每天的点击次数,这种增加是偶然的可能性有多大?