我正在通过aws glue
. 但是我对数据库定义有点困惑。根据我在 aws doc 中可以找到的内容,A database in the AWS Glue Data Catalog is a container that holds tables. You use databases to organize your tables into separate categories.
. 我想知道数据库到底包含什么。它是否从其他数据源加载所有数据并在其上创建目录?还是只包含目录?我如何知道胶水数据库中表的大小?它使用什么类型的数据库,例如nosql
,rds
?
例如,我创建了一个爬虫来从中加载数据s3
并在glue
. 该glue
表是否包含来自 的所有数据s3 bucket
?如果我删除s3
存储桶,它是否会对针对爬虫创建的目录表运行的胶水中的其他作业产生影响?
如果目录表仅包含数据架构,如果我的数据源被修改,我如何保持它更新到数据?