我对数据块上的 Delta 和 Lakehouse 还很陌生。基于以下操作,我有一些问题:
- 我导入了一些镶木地板文件
- 将它们转换为 delta(创建 1 个 snappy.parquet 文件)
- 删除一个随机行(创建 1 个新 snappy.parquet 文件)。
- 我检查了两个 snappy 文件(增量表的版本 0 和版本 1)的内容,它们都包含所有数据,每个数据都有其特定的差异。
这是否意味着 delta 只是为每个新版本复制数据?
这是如何扩展的?还是我错过了什么?
我对数据块上的 Delta 和 Lakehouse 还很陌生。基于以下操作,我有一些问题:
这是否意味着 delta 只是为每个新版本复制数据?
这是如何扩展的?还是我错过了什么?