我尝试从此链接加载棒球统计数据。当我使用从文件中读取它时
data <- read.csv("MLB2011.csv")
它似乎将所有字段作为因子值读取。我尝试通过以下方式删除这些因子值:
read.csv("MLB2011.xls", as.is= FALSE)
..但看起来这些值仍被视为因素。我该怎么做才能将它们加载为简单的字符值而不是因子?
您不是在读取csv
文件,它是一个 excel 电子表格(.xls 格式)。它包含两个工作表bat2011
和pitch2011
你可以使用XLConnect
图书馆来阅读这个
library(XLConnect)
# load the work book (connect to the file)
wb <- loadWorkbook("MLB2011.xls")
# read in the data from the bat2011 sheet
bat2011 <- readWorksheet(wb, sheet = 'bat2011')
readWorksheet
有一个colType
可用于指定列类型的参数。
编辑
如果您已经将工作表保存为 csv 文件,那么
as.is = TRUE
或stringsAsFactors = FALSE
将是正确的参数值