2

我想根据我创建的一些二进制数据计算基于贝叶斯网络的条件概率。但是,使用bnlearn::cpquery,总是返回 0 值,同时bnlearn::bn.fit适合正确的模型。

# Create data for binary chain network X1->Y->X2 with zeros and ones.
# All base rates are 0.5, increase in probability due to parent = .5 (from .25 to.75)
X1<-c(rep(1,9),rep(1,3),1,rep(1,3),rep(0,3),0,rep(0,3),rep(0,9))
Y<-c(rep(1,9),rep(1,3),0,rep(0,3),rep(1,3),1,rep(0,3),rep(0,9))
X2<-c(rep(1,9),rep(0,3),1,rep(0,3),rep(1,3),0,rep(1,3),rep(0,9))
dag1<-data.frame(X1,Y,X2)

# Fit bayes net to data.
res <- hc(dag1)
fittedbn <- bn.fit(res, data = dag1)
# Fitting works as expected, as seen by graph structure and coefficients in fittedbn:
plot(res)
print(fittedbn)

# Conditional probability query
cpquery(fittedbn, event = (Y==1), evidence = (X1==1), method = "ls")
# Using LW method
cpquery(fittedbn, event = (Y==1), evidence = list(X1 = 1), method = "lw")

'cpquery' 只返回 0。我也尝试过使用该predict函数,但是这会返回一个错误:

predict(object = fittedbn, node = "Y", data = list(X1=="1"), method = "bayes-lw", prob = True)
# Returns:
# Error in check.data(data, allow.levels = TRUE) : 
#  the data must be in a data frame.

在上面cpquery的预期结果是 0.75,但返回 0。这并不特定于该事件或证据,无论我放入什么事件或证据(例如event = (X2==1), evidence = (X1==0)event = (X2==1), evidence = (X1==0 & Y==1)),该函数都返回 0。

我尝试过的一件事,因为我认为少量的观察可能是一个问题,就是增加观察的数量(即将上述数据框与自身垂直连接很多次),但这并没有改变输出。

我已经看到很多线程cpquery并且它可能很脆弱,但没有一个表明这个问题。注意:“cpquery”文档中的示例按预期工作,因此问题似乎不是由于我的环境造成的。

任何帮助将不胜感激!

4

0 回答 0