我将这些镶木地板文件分区,所以在多个文件中。
我可以阅读它们
df_test <- arrow::open_dataset('/path/topic.parquet',
partitioning=c("id"))
因为在真正使用它之前我必须做很多转换,所以我想要一个懒惰的 DF,这要归功于dtplyr
.
df_test_lazy <- arrow::open_dataset('/path/topic.parquet',
partitioning=c("id")) %>% lazy_dt()
我有错误
as.data.frame.default(x, ...) 中的错误:无法将类 'c("FileSystemDataset"、"Dataset"、"ArrowObject"、"R6")' 强制转换为 data.frame
如何使用lazy_dt()
来读取我的数据?