我们有一个现有的基础架构,我们正在通过 aws 爬虫爬取 S3 目录。这些 S3 目录是作为 AWS datalake 的一部分创建的,并通过 spark 作业转储。现在为了实现 delta 功能,我们在 deltalake 上进行了 POC。因此,当我通过 spark-delta Jobs 在 S3 中编写这些 deltalake 文件时,我的爬虫无法从这些爬虫创建表。
我们可以使用 AWS 爬虫来爬取 delta Lake 文件吗?
我们有一个现有的基础架构,我们正在通过 aws 爬虫爬取 S3 目录。这些 S3 目录是作为 AWS datalake 的一部分创建的,并通过 spark 作业转储。现在为了实现 delta 功能,我们在 deltalake 上进行了 POC。因此,当我通过 spark-delta Jobs 在 S3 中编写这些 deltalake 文件时,我的爬虫无法从这些爬虫创建表。
我们可以使用 AWS 爬虫来爬取 delta Lake 文件吗?