0

客观的

说明是否可以使用 AWS Lake Formation 的现有 Glue 数据目录和 S3 数据创建 SageMaker 功能组(在功能存储中)。

背景

AWS Lake Formation 应该是与 Glue 数据目录集成并支持跨账户的分析基础。

AWS re:Invent 2020:数据湖:使用 AWS Lake Formation 轻松构建、保护和共享

在此处输入图像描述

在此处输入图像描述

如果有现有的 Glue 数据目录和由 Lake Formation 管理的中央存储库中管理的数据,则应该有一种方法可以重用它。但是,找不到从它们创建 SageMaker 功能组的方法。相反,显然 SageMaker Feature Group 有自己的 Re:Invent 方法来创建冗余 Glue 数据目录和 S3 中的数据,称为“离线特征存储”。

在此处输入图像描述

SageMaker Feature Store 似乎也在推广自己的跨账户共享方式。

跨账户访问概览

本部分概述了如何通过 AWS Security Token Service (AWS STS) 使用代入角色在两个账户之间启用 Feature Store 的跨账户访问。

问题

请告知是否可以通过重用 S3 中的现有 Glue 数据目录和数据从 Lake Formation 创建 SageMaker 功能组。或者,如果这是有人总结的另一个内聚 AWS Re:Invent 示例。

并不是说 AWS 比 GCP 更难使用,而是它不必要地难;基础设施原语的杂乱无章的蔓延,它们之间的凝聚力很差

挑战是好的,混乱的混乱不是,AWS 的问题是你的大部分工作时间将花在整理他们的文档和筛选功能和产品以找到你想要的东西,而不是专注于有趣的有趣挑战.

如果我误解了某些东西并且有技术原因导致它不能与 Lake Formation 紧密结合,请帮助理解它。

4

0 回答 0