我正在创建一个数据存储库,更像是为无 SQL 数据库创建数据湖。我有一些没有正确架构的字段。它们具有混合类型对象,例如字段值为 {a:2} 或 {b:2,c:4, a: {1,2}} 等。
我可以使用 CSV 格式,因此可以节省空间/存储,但由于非结构化/无模式对象,我将使用 JSON 文件。
有没有其他方法来存储数据?
我使用 AWS S3 作为数据湖的存储。
我正在创建一个数据存储库,更像是为无 SQL 数据库创建数据湖。我有一些没有正确架构的字段。它们具有混合类型对象,例如字段值为 {a:2} 或 {b:2,c:4, a: {1,2}} 等。
我可以使用 CSV 格式,因此可以节省空间/存储,但由于非结构化/无模式对象,我将使用 JSON 文件。
有没有其他方法来存储数据?
我使用 AWS S3 作为数据湖的存储。