3

去年我一直在搞乱 R,现在想更深入一点。我想了解有关ffandbig data包的更多信息,因为在阅读某些文档时遇到了麻烦。

我喜欢边做边学,所以假设我有一个名为 data.csv 的巨大 CSV 文件及其 300 mbs。它有 5 个标题 Url、PR、tweets、likes、age。我想根据 URL 对列表进行重复数据删除。然后我想在散点图上绘制 PR 和 likes,看看是否有任何相关性。我将如何进行基本分析?

我总是对大数据流程的分块以及如何无法一次加载所有内容感到困惑。

您在使用 ff 包或大数据时遇到过哪些常见问题?有没有其他更好用的包?

基本上,任何开始在 R 中使用大量数据的信息都会很有用。

谢谢!

尼科

4

0 回答 0