问题标签 [stitch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
493 浏览

google-bigquery - 如何在视图或计划查询之间进行选择,以对通过 Stitch 导入的 BigQuery 表进行重复数据删除?

我根据存储在 BigQuery 表中的数据构建按需生成的统计输出。每天使用“仅附加”通过缝合导入一些数据。这导致在导入的表中出现重复的观察结果(大约 20kk 行每年增长 8kk)。

我可以安排一个 BigQuery 查询以将重复数据删除的值存储在已清理的表中,或者构建视图来执行相同的操作,但我不了解以下方面的权衡:

  • BigQuery存储/运行计划查询和视图的成本。
  • 稍后查询的速度取决于去重视图。视图是否缓存?

我是否正确地假设存储去重数据的每日计划查询成本更高(用于重写存储的表)但加快了以后对去重数据的查询(节省使用成本)?

重复数据删除后的数据将依次每天被查询数百次,以生成关注响应性的仪表板输出。

在决定更好的解决方案时我应该如何争论?

0 投票
1 回答
207 浏览

azure - 用于 MongoDB 迁移的 Delta Lake Gen2

对于 MongoDB 迁移,您更喜欢哪种 Azure 管道和数据存储?

我知道存在 Azure 迁移服务的功能,您可以将 MongoDB 数据直接转移到 Azure CosmosDB。Azure 迁移服务似乎仅适用于特定许可证。使用 Cosmos DB 还需要考虑成本。另一种可能性是使用 Stitch 将 MongoDB 直接转移到 Azure。

由于我们不想使用其他工具,因此我们想使用 Azure 数据工厂将 MongoDB 数据转移到 Azure 数据存储中。我们想使用 Data Lake Storage Gen2,因为它结合了 Blob Storage 和 Data Lake Storage Gen1 的优点。

您更喜欢哪个管道?有在 Azure Data Lake Storage Gen2 中存储 MongoDB 数据的经验吗?

0 投票
0 回答
63 浏览

android - 如何为 MongoDB Atlas 中的每个设备建立单一连接?

我有一个使用 firebase 进行身份验证并使用 MongoDb 作为后端的 Android,我目前在连接限制为 500 的 M0 集群上。我使用 Stitch API。当我从我的设备上使用应用程序时,连接数从 4 个增加到 8 个。我认为默认情况下最初的 4 个连接,所以我不介意,但我真的很担心来自单个设备的连接数会出现这样的跳跃. PS。我尝试将 StitchAppClient 和 RemoteMongoClient 放在公共类中,以便有一个实例,但这也不起作用。

我在下面附上连接图,请帮忙。在此处输入图像描述

0 投票
0 回答
79 浏览

facebook - 结果/转化的 Facebook API 指标

我已经设置了 Facebook 活动来捕获URL 包含的所有 URL 流量,这是我的自定义转换。它会生成一个自定义转化 ID和一个数据源像素 ID。基于这些,我可以在管理面板中的“结果”部分下看到“结果

现在我已经使用 Stitch 将它连接到 Snowflake,它提取了大量类似 json 的元素,但我似乎无法将其中任何一个与 Result 部分匹配。我应该去哪里看?还是我在集成中遗漏了什么?类 JSON 元素示例:

为了给您更多的上下文,上面的规范来自 ADS_INSIGHTS 表 -> UNIQUE_ACTIONS 列,同时还有许多其他表(请参见下图),因此要将其过滤到上述 json 选择,我加入ADS_INSIGHTS 和广告 ID 上的 ADS,让我可以按广告名称过滤数据并仅检查有效广告。

所以我的问题是:在所有这些中,我在哪里可以找到等效的结果?我应该关注哪些转化?我在这里阅读了文档,但仍然没有得到它,而且我的整体转换在本机 Fb 仪表板界面和我在 Snowflake 中看到的界面之间不匹配。即,我知道对于给定的广告系列名称,我需要在雪花中查看 9 次转换,但是当我使用接收到的数据时,不同的组合不会呈现这 9 次。请分享想法。

雪花内部

UPD:到目前为止,我能得到的最好的结果是阅读此链接并查看offsite_conversion.custom.<custom_conv_id>表 ADS_INSIGHTS 中的 ACTIONS 列。

0 投票
2 回答
243 浏览

multithreading - GDAL - 多线程 gdalbuildvrt 和 gdalwarp

我需要将很多位于 S3 存储上的 geotiff 拼接到一个大的 geotif 中。

目前我使用以下命令

工作,但痛苦的缓慢。我们在 S3 上处理大约 5-11k 的 geotiff。我怎样才能并行执行此操作。CPU 和网络都没有接近极限,所以我假设它以一种“单线程模式”运行。我看到 gdalwarp 有多个选项,但 gdalbuildvrt 没有。

谢谢你的帮助!

0 投票
0 回答
10 浏览

stitch - 如何使用 StitchData Connect API 为 Zuora 创建数据源?

我正在尝试使用 StitchData Connect API 为 Zuora 创建连接源。

这段代码有什么问题?

我收到 HTTP 状态码 500

0 投票
1 回答
139 浏览

mongodb - Stitch - Mongodb SSL 握手失败:: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:645)

我已经使用stitch数据集成工具将MongoDB数据传输到stitch。但是在运行时出现错误,如下所述

引导我

0 投票
0 回答
59 浏览

python - IndexError:列表索引超出范围。对于 Stitch API,当我使用 python 做 API 时,对于一些输入,我得到输出,只有最后一行有索引错误

我是编程新手。我正在尝试使用 STITCH API 查找化学品的目标。当我运行代码时,对于列表中的某些输入,我得到了输出。但最后,几行显示上面引用的索引错误(例如,如果我有 10 个输入 ID,我得到其中 7 个的输出,其他三个不会运行,因为我得到索引错误)。请在下面查看我的代码并帮助解决问题。我的输入是 PubChem CID 列表,仅此而已。

0 投票
1 回答
46 浏览

snowflake-cloud-data-platform - Snowflake - 具有 Stitch 最佳实践的网络策略?

我知道 Snowflake需要 Stitch 的网络策略才能访问数据库。我也知道我必须将自己的 IP 地址添加到该网络策略才能访问数据。未来管理这个问题的最佳方法是什么?我正在考虑诸如我的 IP 地址更改或添加新用户之类的事件。以下是我能想到的选项:

  1. 只需在网络策略中不断添加和更新 IP 地址
  2. 为允许从任何 IP 地址访问的用户创建不同的网络策略
0 投票
0 回答
13 浏览

surveymonkey - How to replicate more than one Survey from SurveyMonkey using Stitch?

I'm using Stitch to replicate data from surveys that live in Survey Monkey (about 10), the problem is, I don't want to have to add an integration every time a new survey needs to be replicated; so I tried putting all of my surveyIDs in the homonymous field at the time an integration is created like:

surveyID1,surveyID2,surveyID3

but when the historical replication starts it throws an error saying Resource not found which leads me to think that Stitch is looking for that exact string in the surveyIDs

Have any of you guys done this before?