最近我有时间学习数据可视化,作为 Excel 图表的一种替代。我的选择是 R(带有 ggplot2)并且已经开始学习它。
在“R in a nutshell”中,约瑟夫·阿德勒说:
通常,我使用像 Perl 这样的工具来预处理大文件,然后再在 R 中使用它们。
我建议使用 Perl、Python 或 Ruby 之类的脚本语言来预处理大型、复杂的文本文件并将它们转换为可消化的形式。(附带说明一下,我通常在 Excel 中写出字段名称和长度列表,然后使用 Excel 公式创建 R 或 Perl 代码来加载它们。
其背后的理念是 Unix 哲学——让每个工具都做好自己的工作,让它们一起工作。因此,从长远来看,我计划学习:
- R 用于可视化,以及
- 未来用于数据处理的另一种编程语言。
问题是要学习哪种语言?
我没有计算机科学背景,同时 Perl 对我来说太难了。我在网上做了一些搜索,发现 Haskell 和 Clojure 很有趣。由于这里有很多程序员+统计学家,我想知道,哪一个作为大数据处理目的与 R 相得益彰?
缺口