我是一名数学/统计人员,有兴趣更多地了解“数据分析”的工程方面(可能是一个过于宽泛的术语,但这绝对是“我不知道我不知道什么”的情况,所以我不确定如何更具体)。
一旦数据已经存储在某个地方并且我可以访问它,我就可以操作和分析数据,并且我可以编写脚本和 SQL 查询(并且对规范化等事情有一般的了解)。我不知道的是捕获和存储数据的整个工程过程。例如,我听说过的术语我只是模糊理解的含义包括:
- OLAP、OLTP
- 数据仓库
- ETL
- ???
什么是一本好书(或任何其他资源)来了解这些事情?关于数据库设计我应该知道哪些事情(规范化对我来说似乎有点“显而易见”,我什至在我知道这个术语之前就会做一些事情——还有其他事情吗?)?
换句话说,对于属于“分析工程师”这一概括性术语的工作,我应该了解哪些内容以及了解它们的好方法是什么?