2

我有一个小练习要使用 Rstudio 来解决我的统计考试。我试着把它翻译成英文,所以如果有什么不清楚的地方请向我解释。

“模拟 100,000 次出生并使用以下概率:男性 51.3%,女性 48.7%,使用样本函数。

  • 检查获得的男性和女性数量与理论百分比有多少不同。

  • 画出这个实验的概率函数的 PMF 和 CDF(在 50 个出生的样本上)。

  • 计算分布的均值和方差。”

我得到了 51356 个男性和 48644 个女性,相差 56。

但是现在,如何绘制概率函数的 PMF 和 CDF?

这里我放了用来模拟出生的代码:

mysample <- data.frame(sample(c("M","F"),100000,replace=T,prob=c(0.513,0.487)))
names(mysample)<-c("Gender")
males <- subset(mysample, Gender=="M")
females <- subset(mysample,Gender=="F")

theoricM <- 100000*0.513
theoricF <- 100000*0.487
realM <- as.integer(nrow(maschi))
realF <- as.integer(nrow(femmine))

#create a data frame to show differences
result <-data.frame(realM,theoricM,realF,theoricF)
names(result)<- c("Males","Theoric Males","Females","Theoric Females")

和结果:

在此处输入图像描述

希望有人可以帮助我,我知道对于有 R 经验的人来说这是一个非常简单的问题,但我刚开始使用这种语言。

所以感谢所有愿意回复的人。

编辑:

我试过这段代码:

x <- 1:50
plot(x,dbinom(x ,size = 50,prob = 0.513),type="l", ylab="PMF", main="Binomial Distribution PMF")

结果是:

在此处输入图像描述

我想我理解的是,作为非常接近 1/2 的概率,在一组 50 名新生儿中,男性人数将非常接近 25。这是什么情节?而且,这是正确的方法吗?

4

1 回答 1

4

您的代码(和结论)对我来说是正确的。

type="h"使用绘制“高密度”图可能在图形上更好;这更清楚地表明 的非整数值的概率为零x

x <- 1:50
par(las=1,bty="l") ## cosmetic
plot(x,dbinom(x ,size = 50,prob = 0.513),type="h", ylab="PMF", 
     main="Binomial Distribution PMF")

在此处输入图像描述

(当您绘制 CDF/CMF 时,您可能需要使用type="s"type="S"; 请参阅?plot

于 2015-01-07T17:47:34.543 回答