问题标签 [foundry-data-connection]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

27 问题

0 投票

0 回答

39 浏览

palantir-foundry - 将 QuickBooks 与 Foundry 连接

有没有人将他们的 QuickBooks 实例与 Foundry 连接？我有点不清楚如何在 QuickBooks 上设置东西，然后在 Foundry 端（使用 Rest Source）来获取数据。任何帮助表示赞赏！

palantir-foundry foundry-data-connection

2021-10-12T13:11:23.173

0 投票

0 回答

69 浏览

palantir-foundry - 如何计算 magritte YAML 配置中的分页？

我希望从使用记录偏移系统的 REST API 中提取数据。我需要对返回的 ( current_offset + item_count) 数据执行基本算术以计算下一个偏移量。

不幸的是，这个 API 使用可变的页面大小，所以简单的偏移量不起作用。它也不返回要在响应中使用的下一个偏移量，只返回组件值。

然而，似乎没有办法做我能看到的基本算术。我只是想念它吗？

palantir-foundry foundry-data-connection

2022-01-06T07:44:39.243

0 投票

3 回答

128 浏览

pyspark - 如何在我的 Foundry Magritte 数据集导出中拥有漂亮的文件名和高效的存储使用率？

我正在使用各种 Magritte 导出任务将 Foundry 数据集中的数据以parquet格式导出到 ABFS 系统（但 SFTP、S3、HDFS 和其他基于文件的导出也会出现同样的问题）。

我要导出的数据集相对较小，小于 512 MB，这意味着它们实际上不需要拆分到多个 parquet 文件中，将所有数据放在一个文件中就足够了。我通过以 a 结束之前的转换来完成此操作，以.coalesce(1)将所有数据放在一个文件中。

问题是：

默认情况下，文件名是part-0000-<rid>.snappy.parquet，每个版本都有不同的删除。这意味着，无论何时上传新文件，它都会与其他文件出现在同一个文件夹中，判断哪个是最新版本的唯一方法是最后修改日期。
每个版本的数据都存储在我的外部系统中，这会占用不必要的存储空间，除非我经常进入并删除旧文件。

所有这些都是不必要的复杂性被添加到我的下游系统中，我只想能够在一个步骤中提取最新版本的数据。

pyspark palantir-foundry foundry-code-repositories foundry-python-transform foundry-data-connection

2022-01-10T13:10:30.930

0 投票

0 回答

52 浏览