0

我正在尝试对已存储为ffdf来自 package 的对象的大型数据集执行聚类ffbase。根据文档ffbase(来自 user!2013 会议的注释),包stream提供了这样做的支持。

我查看了其中的函数,stream但看不到如何将其设置ffdf为流。我认为唯一可能起作用的功能DSD_Wrapper,不起作用。我想我应该使用DSD_ReadStream,但我不知道如何让它工作。

这是一个mwe:

library(ffbase)
library(stream)

ffmt <- as.ffdf(mtcars)
dsmt <- DSD_Wrapper(mtcars) #works fine
dsff <- DSD_Wrapper(ffmt)   #does not work

调查结构表明它是一个非常简单的对象,我可以手动重新创建它,尽管我的实际数据的大小阻止了这一点。

4

0 回答 0