0

我第一次使用统计软件并且正在与 R 苦苦挣扎。我收集了数据并将它们转换为 csv(由于某些原因,它与“;”而不是“;”分开)并导入到 R 中,效果很好. 如果我使用 str 函数并查看摘要,但是我有因子变量和 int 变量但不知道如何更改它,因为我之前在 excel 中格式化了所有列并且它们都说数字。我正在尝试对我的论文进行多元回归,但甚至无法正确上传数据,因此我将不胜感激。

此外,有谁知道我可以在 R 中包含多少个解释变量?

提前致谢。

4

2 回答 2

5

许多选项,将您的值转换为数字,例如 usingas.numeric但更好的是使用colClasses选项 in read.csv。这确保以正确的格式读取数据。

例如:

 read.csv(filename, sep=';',
                     colClasses=c("character",      ## first column is a character
                                  rep("numeric",4)) ## followed by 4 numeric varaibles.

stringsAsFactors=FALSE如果您有超过 5 个变量并且您不想将字符串转换为因子,您也可以结合 this 使用参数。

更多解释可以在??read.csv或更一般地找到??read.table

对于您关于“我可以在 R 中包含多少解释变量?”的模棱两可的问题。,我将其表述为可以读取多少列/变量。读取或创建 matrix/data.frame 的唯一限制是您的 RAM。

于 2013-07-05T13:56:56.573 回答
0

如果read.csv将一些假定的数字变量作为因子或字符串导入,则很可能在那些列中有一些值NULLNA或者其他一些非数字值。检查非数字条目的级别或值,并在 Excel 或 R 本身中消除/处理它们。一旦事情是纯数字,它应该可以很好地读取,或者您可以使用as.integer()or进行后期处理as.numeric()

于 2013-07-05T15:25:07.903 回答