问题标签 [statistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
2988 浏览

statistics - 使用 Awstats 生成 Liferay 门户的使用统计信息

有没有人尝试使用AwstatsLiferay门户生成使用统计信息?

你能分享你的经验吗?

除了 Awstats 和 Google Analytics 之外,还有其他方法可以为 Liferay 门户生成统计信息吗?(我不能使用 Google Analystics,因为它是一个受限的内部门户)

0 投票
3 回答
81 浏览

sql - 处理许多按要求排序的统计数据库列

对于我目前的项目,我们想要展示统计数据并对其进行排名。就我而言,我正在谈论艺术家的“收藏”,计算艺术家曲目的播放次数,显示艺术家曲目已添加到播放列表中的播放列表的计数......这些都是非常特定于域的问题,但这是我的问题的一个具体例子。

主要问题是我将返回按顺序返回的所有这些统计属性的结果集。

这里有些例子:

  • 音乐登陆页面应显示最受喜爱的前 5 位艺术家。
  • 音乐登陆页面应显示播放次数最多的前 5 首曲目。

我的第一个想法是确定我需要一个计算聚合列。由于我想对这些值进行排序,这意味着对于我想要排序的每个聚合,一个 CLUSTERED INDEX 将是最佳的。其次,由于 CLUSTERED INDEX 列上的 DML 在插入时不连续时可能代价高昂,因此我需要将此作为计划作业。

所以,对于艺术家最喜欢的统计数据,这是我想出的 DDL。注意到我的 T-SQL 可能非常糟糕,但我认为意图很明确。

如您所见,我需要为我想要跟踪的每个统计信息创建一个单独的表,否则我将不得不对不在 CLUSTERED INDEX 中的列进行排序。这看起来很丑陋的事实让我觉得我做错了。

我是否应该开始考虑集成 OLAP(我对 OLAP 多维数据集的经验很少)?或者也许是 Lucene?

0 投票
6 回答
24456 浏览

statistics - 简单的多维曲线拟合

我有一堆数据,一般是a,b,c,...,y

其中 y = f(a, b, c...)

其中大多数是三四个变量,并且有 10k - 10M 记录。我的一般假设是它们本质上是代数的,例如:

y = P1 a^E1 + P2 b^E2 + P3 c^E3

不幸的是,我上一次统计分析课是在 20 年前。获得 f 的良好近似值的最简单方法是什么?具有极小学习曲线的开源工具(即我可以在一小时左右得到一个体面的近似值的工具)将是理想的。谢谢!

0 投票
5 回答
1788 浏览

statistics - N 位数组中的 X *连续* 位设置为 1 的概率是多少?

我正在尝试编写一个简单、足够准确的过滤器来验证 RTL 模拟中的硬件。我们通过将设计中的所有触发器随机初始化为 0 或 1 来模拟芯片触发器中固有的随机性。这对应于芯片触发器在上电期间获得一些随机值。我们还随机化了重置树中的触发器(重置树没有反馈循环),这意味着您可能会在重置线上出现错误的故障。

例如

你会看到一个 0->1->0 看起来像重置,但实际上是一个小故障。

我想构建一个过滤器来查找一定数量的连续1 值,以确定我刚刚看到的重置是来自重置控制器的重置还是虚假重置。

我知道这是统计数据,可能与泊松分布有关,但是如何确定一组 N 位中任何 X 个连续位为 1 的概率?

PS是的。我知道 4-val RTL 模拟。我们也在这样做,但是一些 Verilog 构造在传播 X 和 Z 时没有足够的悲观情绪。

0 投票
4 回答
924 浏览

statistics - 机器学习有哪些经济上重要的应用?

如果这太模糊,请提前道歉。

到目前为止我的清单:

  • 统计套利
  • 精算学
  • 制造过程控制
  • 图像处理(安全、制造、医学成像)
  • 计算生物学/药物设计
  • 军刀计量学
  • 收益管理
  • 运筹学/物流(我将包括商业智能)
  • 营销(偏好预测、调查设计/分析、在线广告服务)
  • 计算语言学(谷歌,信息检索,...)
  • 教育测试
  • 流行病学
  • 犯罪学(欺诈检测、反恐……)
  • 消费者信用评分
  • 垃圾邮件检测
  • 错误发现、病毒检测、计算机安全

有没有解决这个问题的文章、书籍或期刊?我看过的唯一一本书是 Supercrunchers,它只关注消费者的偏好。

0 投票
6 回答
2289 浏览

algorithm - 对最近 X 秒内收到的值的平均值进行采样

我有一个调度成功和失败事件的类,我需要维护该类最后 X 秒内失败的平均数/事件总数的统计信息。

我正在考虑使用循环链表并为每个事件附加一个成功或失败节点。然后计算列表中故障节点的数量与总节点的数量,但这有两个主要缺点:

  1. 我需要不断扩大/缩小列表大小以考虑“最后 X 秒”的要求(每秒的事件数可以改变)
  2. 我需要不断循环列表并计算所有事件(可能很昂贵,因为我每秒可能会有 100 个此类事件)

有谁知道从最后 X 秒内收到的样本列表中计算平均值的另一种方法?

0 投票
3 回答
6550 浏览

sql-server - 获取性能统计信息的 SQL 命令

是否有可用于从 MS SQL 2005 中提取性能监控数据的 SQL 命令,例如:

  • 每秒事务数
  • 页面读/写
  • 连接数(@@CONNECTIONS 给出总数,但电流呢)
  • 物理读取
  • 锁和块
  • 其他可能有趣的计数器?
0 投票
1 回答
8477 浏览

r - 如何在 R 的条形图中对 X 轴进行排序?

我已经合并了如下所示的数据:

如何绘制这些数据,以便将 bin 从左侧的最负值排序到右侧的最正值?目前我的图表看起来像这样。请注意,它根本没有排序。特别是第二个栏 ( value = 76) 放置在第一个栏的右侧:

这是我用来绘图的命令:

0 投票
1 回答
2358 浏览

statistics - 使用数据挖掘/统计进行日志监控

我有大量的日志文件,我想描述或可能添加某种决策树或某种分析。但我不知道具体是什么。你对日志文件做了什么样的分析,大量的日志文件。

例如,到目前为止,我正在收集对给定日志文件的特定页面发出的请求数。

Servlet = 60 个请求 Servlet2 = 70 个请求,等等。

我想就在那里,只过滤最流行的请求。此外,在 2 小时内可能会执行 60 个请求。60 / 160 分钟。

0 投票
7 回答
8540 浏览

math - 以 R 为重点学习应用统计学

我知道麻省理工学院和斯坦福大学已经在网上发布了许多关于他们课程的视频。有人知道应用统计学的课程(有在线视频)吗?

我一直在使用 R 并且该工具(从技术方面)非常简单。但是,在统计方面(回归、递归分区等),我一无所知。我已经阅读了一些应用统计学的课程描述,它似乎正是我正在寻找的课程类型。但是,如果有我可以在线观看的视频,我会更喜欢它(而不是试图找到当地的社区大学)。

有没有学习统计学的好视频?最好关注 R?