问题标签 [aggregate]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
2325 浏览

sql - SQL:聚合函数和分组依据

考虑 Oracleemp表。我想用 和 得到薪水最高的department = 20员工job = clerk。还假设没有“empno”列,并且主键涉及许多列。你可以这样做:

这可行,但我必须复制测试 deptno = 20 和 job = 'CLERK',这是我想避免的。有没有更优雅的方式来写这个,也许使用group by? 顺便说一句,如果这很重要,我正在使用 Oracle。

0 投票
10 回答
6590 浏览

python - 为什么 SQL 聚合函数比 Python 和 Java(或可怜人的 OLAP)慢得多

我需要一个真正的 DBA 的意见。Postgres 8.3 在我的 Macbook Pro 上执行此查询需要 200 毫秒,而 Java 和 Python 在 20 毫秒(350,000 行)内执行相同的计算:

这是使用 SQL 数据库时的正常行为吗?

架构(该表包含对调查的回复):

我在 Java 和 Python 中为上下文编写了一些测试,它们粉碎了 SQL(纯 python 除外):

即使 sqlite3 与 Postgres 竞争,尽管它假设所有列都是字符串(相比之下:即使在 Postgres 中仅使用切换到数字列而不是整数也会导致 10 倍的减速)

我尝试过但没有成功的调整包括(盲目地遵循一些网络建议):

所以我的问题是,我在这里的体验是否正常,这就是我在使用 SQL 数据库时可以期待的吗?我可以理解 ACID 必须付出代价,但在我看来这有点疯狂。我不是要求实时游戏速度,但由于 Java 可以在 20 毫秒内处理数百万次双打,我感到有点嫉妒。

有没有更好的方法以便宜的方式进行简单的 OLAP(无论是在资金方面还是在服务器复杂性方面)?我研究过 Mondrian 和 Pig + Hadoop,但对维护另一个服务器应用程序并不太兴奋,也不确定它们是否会有所帮助。


没有 Python 代码和 Java 代码可以说是在内部完成所有工作。我只生成了 4 个数组,每个数组有 350,000 个随机值,然后取平均值。我不包括时间中的生成,只包括平均步骤。java 线程计时使用 4 个线程(每个数组平均一个),过大但绝对是最快的。

sqlite3 计时由 Python 程序驱动,并从磁盘运行(不是:内存:)

我意识到 Postgres 在幕后做了更多工作,但大部分工作对我来说并不重要,因为这是只读数据。

Postgres 查询不会更改后续运行的时间。

我重新运行了 Python 测试,包括将其从磁盘中脱机。时间大大减慢到近 4 秒。但我猜 Python 的文件处理代码几乎是用 C 语言编写的(尽管可能不是 csv lib?)所以这向我表明 Postgres 也没有从磁盘流式传输(或者你是正确的,我应该低头在谁写了他们的存储层之前!)

0 投票
2 回答
2879 浏览

interface - UML aggregation when interfaces are used

How do I represent an aggregation relation between two classes in UML, such that each class has a link to the other class's interface, not the implementing class?

E.g. I have a class Foo that implements iFoo, and Bar that implements iBar. Foo should have a member variable of type iBar, and Bar should have a member variable of type iFoo.

If I create an aggregation between the two implementing classes, then the member will be of the type of the implementing class, not the superclass. And aggregations between interfaces are invalid in UML (and don't make much sense).

0 投票
1 回答
429 浏览

aggregate - NDepend CQL 计数查询

我想查询特定类的公共方法表以及 NDepend CQL 中每个方法的使用计数。当前查询如下所示:

是否可以在 CQL 中聚合查询?

0 投票
6 回答
302819 浏览

sql - 如何使用 GROUP BY 连接 MySQL 中的字符串?

基本上问题是如何从中得到:

对此:

0 投票
11 回答
378 浏览

sql - 如何连接表中的最新行?

我经常遇到这种形式的问题,但还没有找到好的解决方案:

假设我们有两个代表电子商务系统的数据库表。

对于系统中的所有用户,选择他们的用户信息、类型='1'的最新订单信息和类型='2'的最新订单信息。我想在一个查询中做到这一点。这是一个示例结果:

0 投票
1 回答
968 浏览

sql-server - 在 SQL 查询中对拆分范围求和

我有一个包含我的服务器状态的表

我想要一个给定开始和结束日期的查询,它将总结服务器在此期间在每个状态中花费的时间。我还希望查询返回服务器处于未知状态的时间量。

因此,例如对于以下数据

提供范围。

我想返回结果:

这个问题有点相关:Combining split date range in a SQL query

0 投票
2 回答
1278 浏览

php - 如何使用 google feed api 检测 feed 更新

因为我运行一个博客聚合器网站,它每小时检查大量 RSS 提要列表以获取新帖子,所以如果可以使用谷歌提要 api 或谷歌 AJAX 提要 API而不是让 cron 作业读取整个提要,我会很高兴知道它是否更新。喜欢这个链接文字

0 投票
4 回答
3688 浏览

sql - 使用 T-SQL 聚合仅相邻的记录

我有(为示例简化)一个包含以下数据的表

日期代表一个时间段,ID 是系统在该时间段内所处的状态,而金额是与该状态相关的值。

我想要做的是聚合具有相同ID 号的相邻行的数量,但保持相同的整体顺序,以便可以组合连续的运行。因此,我想得到如下数据:

我追求可以放入 SP 的 T-SQL 解决方案,但是我看不到如何通过简单的查询来做到这一点。我怀疑它可能需要某种迭代,但我不想走那条路。

我想要进行此聚合的原因是该过程的下一步是执行按序列中出现的唯一 ID 分组的 SUM() 和 Count(),这样我的最终数据将类似于:

但是,如果我做一个简单的

在原来的桌子上,我得到了类似的东西

这不是我想要的。

0 投票
2 回答
2662 浏览

linq-to-sql - 最简洁的 LINQ To SQL 用于获取多对多任一侧的 COUNT(*)?

请帮助我进行健全性检查。假设多对多关系:

发布,PostTagAssoc,标签 http://www.codingthewheel.com/pics/many_to_many.gif

什么是最简洁的方式(使用 LINQ to SQL)来获得一个结果集,显示每个标签(或帖子)分配给它的帖子(或标签)的总数?

谢谢!