问题标签 [snowflake-cloud-data-platform]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

6637 问题

0 投票

1 回答

650 浏览

amazon-web-services - 如何将 SnowFlake S3 数据文件导出到我的 AWS S3？

Snowflake S3 数据在 .txt.bz2 中，我需要将此 SnowFlake S3 中存在的数据文件导出到我的 AWS S3，导出的结果必须与源位置中的格式相同。这是我试过的。

COPY INTO @mystage/folder from (select $1||'|'||$2||'|'|| $3||'|'|| $4||'|'|| $5||'|'||$6||'|'|| $7||'|'|| $8||'|'|| $9||'|'|| $10||'|'|| $11||'|'|| $12||'|'|| $13||'|'|| $14||'|'||$15||'|'|| $16||'|'|| $17||'|'||$18||'|'||$19||'|'|| $20||'|'|| $21||'|'|| $22||'|'|| $23||'|'|| $24||'|'|| $25||'|'||26||'|'|| $27||'|'|| $28||'|'|| $29||'|'|| $30||'|'|| $31||'|'|| $32||'|'|| $33||'|'|| $34||'|'|| $35||'|'|| $36||'|'|| $37||'|'|| $38||'|'|| $39||'|'|| $40||'|'|| $41||'|'|| $42||'|'|| $43 from @databasename) CREDENTIALS = (AWS_KEY_ID = '*****' AWS_SECRET_KEY = '*****' ) file_format=(TYPE='CSV' COMPRESSION='BZ2'); PATTERN='*/*.txt.bz2

2017-02-18T01:03:46.167

0 投票

6 回答

54852 浏览

python - 将一个大的 json 文件拆分为多个较小的文件

我有一个大的 JSON 文件，大约 500 万条记录和大约 32GB 的文件大小，我需要将其加载到我们的雪花数据仓库中。我需要把这个文件分成每个文件大约 200k 条记录（大约 1.25GB）的块。我想在 Node.JS 或 Python 中执行此操作以部署到 AWS Lambda 函数，不幸的是我还没有编写任何代码。我有 C# 和大量 SQL 经验，并且学习 node 和 python 都在我的待办事项清单上，所以为什么不直接潜入，对吧！？

我的第一个问题是“哪种语言更适合这个功能？Python 还是 Node.JS？”

我知道我不想将整个 JSON 文件读入内存（甚至输出较小的文件）。我需要能够根据记录数（200k）将其“流式传输”到新文件中，正确关闭 json 对象，并继续进入另一个 200k 的新文件，依此类推。我知道 Node 可以做到这一点，但如果 Python 也可以做到这一点，我觉得快速开始使用其他 ETL 东西会更容易，我很快就会做。

我的第二个问题是“根据您上面的建议，您能否推荐我应该需要/导入哪些模块来帮助我开始？主要是因为它与不将整个 json 文件拉入内存有关？也许是一些提示、技巧或'你会怎么做？如果你真的很慷慨，一些代码示例可以帮助我深入了解这个？

我不能包含 JSON 数据的样本，因为它包含个人信息。但我可以提供 JSON 模式......

python json node.js lambda snowflake-cloud-data-platform

2017-03-28T15:48:01.573

0 投票

0 回答

63 浏览

sql - 如何减去特定条件为真的产品数量

我想减去首先访问'OF'然后访问'OP'的访问次数visitorId（但它应该在不同的日期）并且还想将上述结果分组为

等等

sql snowflake-cloud-data-platform

2017-05-02T06:49:00.147

0 投票

2 回答

3142 浏览

r - 通过单点登录将数据从 Snowflake 导入 R

我可以将数据直接从雪花数据库导入 R 吗？我可以通过使用我的 Snowflake 凭据创建 ODBC 连接来做到这一点；但是，我的公司将 Snowflake 切换为单点登录，我无法让它工作。

r snowflake-cloud-data-platform

2017-05-09T14:31:45.370

0 投票

2 回答

2117 浏览

jdbc - 如何在 Snowflake JDBC 中执行批量更新

我正在尝试对 PreparedStatement 执行雪花批量更新，但没有成功。我能够执行每个单独的查询（preparedStatement.executeQuery()），以便查询工作。但是一旦我切换到batchUpdate()，我就会得到一个似乎没有设置我的变量的异常（在insertEventStatement.executeBatch() 中抛出）。

有人看到我可能会错过什么吗？

以下是查询：

编辑：显然，它在我使用的 JDBC 版本（3.0.18）中不可用，但在最近的版本（3.0.21）中添加。如果它不起作用，我会进一步更新。

jdbc snowflake-cloud-data-platform

2017-06-14T20:17:37.920

0 投票

2 回答

667 浏览