问题标签 [amazon-redshift]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - redshift drop 或 truncate table 非常非常慢
在我的 redshift 数据库中删除或截断一个不太大的表(4M 行)时,需要很长时间(小时)才能完成。有人遇到同样的问题吗?
谢谢
amazon-redshift - ParAccel 中存在哪些编码?
任何人都有 ParAccel 文档的链接,我可以在其中找到 ParAccel 具有的所有列编码以及每个列的描述和示例?
谢谢!
amazon-redshift - 适用于 SaaS 应用程序的 Amazon Redshift
我目前正在为 SaaS 近实时分析应用程序测试 Redshift。查询性能在 100M 行数据集上很好。
但是,当更多用户同时使用该应用程序时,每个集群 15 个查询的并发限制将成为一个问题。
我无法缓存所有聚合结果,因为我们授权在每个查询上自定义过滤器(临时查询)
申请的要求是:
- 查询必须在 10 秒内返回结果
- 在超过 100 列上使用过滤器的即席查询
- 在应用程序上同时连接 1 到 50 个客户端
- 数据集以 1000 万行/天的速度增长
- 典型的查询是带有聚合函数 COUNT 的 SELECT,带有 1 或 2 个连接的 AVG
Redshift 不适合这个用例吗?对于这些要求,您还会考虑哪些其他技术?
sql - 亚马逊红移中的sql加入没有结果错误
这似乎是我做过无数次的亚马逊红移的简单加入,但它给了我以下错误:
'查询没有返回任何结果。[SQL 状态=02000]'
这是sql:
附加信息:
-table 1(创建时没有错误)约为 6K 行
-table 2(创建时未出错)约为 10K 行
-这些表确实有共同的 product_campaign_id,但这并不重要
谢谢
amazon-web-services - Amazon Redshift 安全组问题
添加新安全组或修改现有安全组时,影响不可见。例如,我有一个名为“mdi-sg-redshift”的安全组,它有两条规则:
如您所见,这些规则允许来自全球任何人的入站。当应用于集群时,它们应该允许这些端口的入站。不工作!我已经重新启动集群没有影响。这是我的 Redshift 集群的快照:
这是端口扫描器的快照。
集群重启了几次都没有效果。
另请注意,集群与 VPC 和安全组属于同一区域。集群属于应用了安全组的 VPC。
我在 EC2 端看到过类似的问题,但重启通常会修复它。这次不行。
有见解的人吗?谢谢!
amazon-redshift - Sandbox version for AWS RedShift
I have been using RedShift for a few months and I like it. But I need to add some tests around it and I am not sure what the most cost effective way of doing it is. I can only think of using one server RedShift cluster as Sandbox but that seems to be too costly even if I only use it during testing
sql - 如何(以编程方式)知道何时在 PostgreSQL/Amazon Redshift 上完成查询?
有没有办法以编程方式检查 Redshift/PostgreSQL 中的查询状态?我如何知道查询何时完成运行?
我有一个应用程序可以按顺序运行一系列 SQL 查询。它运行一个查询并等待它完成,然后再执行下一个查询。我需要知道查询何时完成运行。
我无法同步运行它们,因为有时 Redshift/PostgreSQL 在执行完查询后不提供放弃控制(对于长查询)。有什么办法吗?
amazon-redshift - 如何复制 IDENTITY 字段?
我想更新表的一些参数,例如 dist 和 sort 键。为此,我重命名了旧版本的表,并使用新参数重新创建了表(一旦创建表就无法更改这些参数)。
我需要保留旧表中的 id 字段,这是一个 IDENTITY 字段。但是,如果我尝试以下查询,则会收到错误消息:
如何从旧表中保留相同的 id?
amazon-redshift - temporarily shut down redshift to reduce bill
Amazon says the following on Redshift billing "Node usage hours are billed for each hour your data warehouse cluster is running in an Available state. If you no longer wish to be charged for your data warehouse cluster, you must terminate it to avoid being billed for additional node hours." This means if I just create a cluster and whether use it or not I'll be billed 24/7 because the cluster doesn't have any state like "Suspend". Is there a way to shut down the whole Redshift server when not in use so that I'll be billed only for the hours when I want to use the clusters?
Edit: With Tomasz's reply it sounds like if I want to shutdown the cluster on weekend it'll be like backing up the whole database on Friday evening and restoring on Sunday evening. This doesn't sound good. What does Amazon really mean when they say "PAY ONLY FOR THE HOURS YOU USE"?
Can you tell me how much time will it take to backup/restore a data warehouse of size around 100GB? Can I automatically associate security groups to the cluster after restoring from the Java code?