4

在 Palantir Foundry 平台内,我从事数据集成工作。我需要一些帮助,因为我是 Palantir 软件的新手。是否有关于该主题的任何文档、白皮书、链接或教程?

如何集成来自其他来源的数据,例如 Amazon S3 或 HDFS?

4

2 回答 2

8

要集成来自另一个平台的数据,您需要数据源和数据连接同步。您需要拥有平台权限才能创建这些,并非所有用户都可以,因为它可能涉及组织数据治理策略。

假设您没有具有 S3 有效配置的源。您需要创建一个。在数据连接上,单击“源”,然后单击“新源”。然后,您可以通过两种方式执行此操作:

  • 使用预构建的 S3 源:单击File SystemNew Source下拉菜单并按照向导步骤操作
  • 使用自定义连接器,例如 magritte-rest:单击Custom同一下拉菜单。

对于马格利特休息:

  • 根据您的偏好选择任一可用代理或云摄取
  • 为其命名并将其保存到文件夹中。
  • 添加配置,如:
type: magritte-rest
url: 'https://foobar.organization.s3.amazonaws.com'

现在要创建同步,请使用与此类似的配置:

type: rest-source-adapter
method: GET
path: the/path/in/s3/yourdata
outputFileType: csv

还支持其他输出文件类型(json, zip, ...)

于 2020-09-25T07:08:45.870 回答
6

Palantir 通常在客户公司的 Intranet 上提供一个问答论坛,以帮助开发人员和解决问题。

此外,他们还提供现场支持,在 Foundry 工作区主页上有一个名为“培训与学习”的部分,提供示例和入门教程。

于 2019-02-19T08:26:03.223 回答