我正在尝试对已存储为ffdf
来自 package 的对象的大型数据集执行聚类ffbase
。根据文档ffbase
(来自 user!2013 会议的注释),包stream
提供了这样做的支持。
我查看了其中的函数,stream
但看不到如何将其设置ffdf
为流。我认为唯一可能起作用的功能DSD_Wrapper
,不起作用。我想我应该使用DSD_ReadStream
,但我不知道如何让它工作。
这是一个mwe:
library(ffbase)
library(stream)
ffmt <- as.ffdf(mtcars)
dsmt <- DSD_Wrapper(mtcars) #works fine
dsff <- DSD_Wrapper(ffmt) #does not work
调查结构表明它是一个非常简单的对象,我可以手动重新创建它,尽管我的实际数据的大小阻止了这一点。