我正在尝试使用二项分布来测试一个“随机”模型是否在 50% 的时间随机响应“virginica”,在 25% 的时间响应“setosa”,在最后 25% 的时间响应“versicolor”我的逻辑回归模型是否更准确,反之亦然。这可以做到吗?这是我的尝试...
library(datasets)
iris$dummy_virginica_iris <- 0
iris$dummy_virginica_iris[iris$Species == 'virginica'] <- 1
iris$dummy_virginica_iris
# Logistic regression model.
glm <- glm(dummy_virginica_iris ~ Petal.Width + Sepal.Width,
data = iris,
family = 'binomial')
summary(glm)
# Classifer.
glm.pred <- predict(glm, type="response")
virginica <- ifelse(glm.pred > .5, TRUE, FALSE)
table(iris$Species, virginica)
# Table of predictions.
table(virginica, iris$dummy_virginica_iris)
# Binomial distribution??
rbinom(160, 1, 0.5)