其目的涉及找到洗衣机故障 (0,1) 的因果关系。逻辑分布的命令创建了随机变量,但因变量全为 1。来自其他逻辑分布的模拟创建了随机的 0 和 1 值。
变量 Hrs2、WashCap 和 SpinSp 创建为 n=3000 的正态分布。我更改了平均值和 SD 以在直方图的 x 轴上拟合所需的间隔。
# Hours2
set.seed(600)
Hrs2 <- rnorm(3000, mean=300, sd=100)
#WashCap
set.seed(5)
WashCap <- rnorm(3000, mean=2.5, sd=1)
#SpinSp
set.seed(1100)
SpinSp <- rnorm(3000, mean=550, sd=250)
逻辑分布的差异包括带有偏差的线性组合的附加变量。
z=1 + 2*Hrs2 + 3*WashCap + 4*SpinSp
pr = 1/(1+exp(-z))
y <- rbinom(3000,1,pr)
WashMa = data.frame(y=y, Hrs2=Hrs2, WashCap=WashCap, SpinSp=SpinSp)
glm( y~Hrs2+WashCap+SpinSp,data=WashMa, family=binomial)
有没有固定因变量以产生变化的想法?