2

所以这是我的问题:

我有一堆关于声音制作以及重点放在一个词中的数据。我要做的是确定重读音节和非重读音节的产生之间的差异是否显着。问题是当我尝试使用 cor() 函数时,数据集的长度不同。我有大约 500 个重读音节,但只有 400 个非重读音节。我对 r 很陌生,但这是我尝试过的代码:

data <- read.csv('D:/blaaah/Stressed.csv', header=TRUE)
var1 <- data$intdiff
data <- read.csv('D:/blaaah/Unstressed.csv', header=TRUE)
var2 <- data$intdiff
cor(var1, var2)

当然,我得到一个错误,因为数据集的长度不同。那么如何在不让它们具有相同长度的情况下检查集合之间的重要性呢?

非常感谢!

PS只要问我的问题是否不清楚。恐怕我有时会假设每个人都知道我在做什么...

4

1 回答 1

4

如果您希望var1var2之间存在关系,则使用 cor() 将是合适的,例如,如果您希望var2中的项目的值更大,而var1中的相应项目更大。当数据集的长度不同时会出现困难,因为一旦超过较短数据集的末尾,就没有相应的项目可以比较。

我认为,在这种情况下,比较两个数据集以确定它们的均值是否不同更有可能对您有用。为此,您希望在测试中使用 R 中的示例,如前所述,请参见此处。您还想确认使用 t 检验的假设对于这种情况是有效的,例如,请参见此处

于 2013-01-12T00:25:21.003 回答