Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
如果 datamart 是 datawarehouse 的逻辑划分,那么它在 datalake 中对应的是什么?在数据湖中是否有任何设计,如星形或雪花模式?
数据湖的概念是在一个地方提供所有类型的数据,因此它们中的大多数预计不会完全组织起来,如日志或社交媒体提要,因此没有数据集市的等效概念。
无论如何,为数据湖提供某种组织也是有用的,但如何做取决于您。一个简单的方法,但可能不是那么有用,是源代码。即所有日志都在一个地方,so.me。喂另一个等等。
数据湖的一个非常有用的概念是能够知道那里有什么以及它是如何命名的,因此数据字典对于查找信息和理解信息都非常有用。