r - 通过对 R 中的数据框进行子集化来缩小对象内存

Question

df = read.csv('Hotel_Reviews.csv')
object.size(df)

200503848 字节

object.size(df[sample(1:nrow(df),500),])

157225848 字节

通过获取 0.1% 的数据，我只将数据缩小到 75%。我不明白为什么...

score 2 · Accepted Answer

好吧，在更深入地研究之后，似乎是因为我的数据框是由因素组成的，甚至通过子集，它保持空级别

df = read.csv('Hotel_Reviews.csv',stringsAsFactors = FALSE)
object.size(df)

210584168 字节

object.size(df[sample(1:nrow(df),500),])

394464 字节

1 回答 1