我第一次使用统计软件并且正在与 R 苦苦挣扎。我收集了数据并将它们转换为 csv(由于某些原因,它与“;”而不是“;”分开)并导入到 R 中,效果很好. 如果我使用 str 函数并查看摘要,但是我有因子变量和 int 变量但不知道如何更改它,因为我之前在 excel 中格式化了所有列并且它们都说数字。我正在尝试对我的论文进行多元回归,但甚至无法正确上传数据,因此我将不胜感激。
此外,有谁知道我可以在 R 中包含多少个解释变量?
提前致谢。
我第一次使用统计软件并且正在与 R 苦苦挣扎。我收集了数据并将它们转换为 csv(由于某些原因,它与“;”而不是“;”分开)并导入到 R 中,效果很好. 如果我使用 str 函数并查看摘要,但是我有因子变量和 int 变量但不知道如何更改它,因为我之前在 excel 中格式化了所有列并且它们都说数字。我正在尝试对我的论文进行多元回归,但甚至无法正确上传数据,因此我将不胜感激。
此外,有谁知道我可以在 R 中包含多少个解释变量?
提前致谢。
许多选项,将您的值转换为数字,例如 usingas.numeric
但更好的是使用colClasses
选项 in read.csv
。这确保以正确的格式读取数据。
例如:
read.csv(filename, sep=';',
colClasses=c("character", ## first column is a character
rep("numeric",4)) ## followed by 4 numeric varaibles.
stringsAsFactors=FALSE
如果您有超过 5 个变量并且您不想将字符串转换为因子,您也可以结合 this 使用参数。
更多解释可以在??read.csv
或更一般地找到??read.table
对于您关于“我可以在 R 中包含多少解释变量?”的模棱两可的问题。,我将其表述为可以读取多少列/变量。读取或创建 matrix/data.frame 的唯一限制是您的 RAM。
如果read.csv
将一些假定的数字变量作为因子或字符串导入,则很可能在那些列中有一些值NULL
,NA
或者其他一些非数字值。检查非数字条目的级别或值,并在 Excel 或 R 本身中消除/处理它们。一旦事情是纯数字,它应该可以很好地读取,或者您可以使用as.integer()
or进行后期处理as.numeric()
。