我是 R 的长期用户,最近开始使用 Python。使用传统的 RDBMS 系统进行数据仓库,使用 R/Python 进行数字运算,我觉得现在有必要亲自动手进行大数据分析。
我想知道如何开始使用大数据处理。- 如何从 Map/Reduce 和 Hadoop 的使用开始简单
- 如何利用我在 R 和 Python 方面的技能开始大数据分析。以 Python Disco 项目为例。
- 使用 RHIPE 包并查找玩具数据集和问题区域。
- 找到正确的信息,让我决定是否需要从 RDBMS 类型的数据库迁移到 NoSQL
总而言之,我想知道如何从小处着手,逐步建立我在大数据分析方面的技能和专业知识。
感谢您的建议和建议。对于此查询的一般性质,我深表歉意,但我希望获得有关此主题的更多观点。
- 残酷的