问题标签 [statistics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
4613 浏览

statistics - 开源或免费的财务分析程序/库

我正在寻找包含与 Matlab 的金融和金融衍生工具箱类似功能的东西,但没有现金可以花在 matlab 上。我将不胜感激有关免费或开源库或程序的任何信息,这些信息可以让我轻松计算利率、风险等。

0 投票
2 回答
1623 浏览

web-applications - Java EE Web 应用程序的统计引擎

我们正在开发一个 Java EE Web 应用程序,营销人员需要我们网站的一些非常详细的统计数据。类似于谷歌分析的东西,收集用户的信息,以及他们在网站上的导航(他们来自哪里,他们点击了什么,他们去哪里等等)。

不能选择依赖分析等第三方服务。

他们还希望将这些信息以图表和内容的形式呈现出来,这并不难,因为一旦收集了数据,它只是关于正确的查询和我们显示它的方式。

不想重新发明轮子,你知道是否有任何 API、框架或其他类型的库可以添加到项目中来实现这个目标?

0 投票
2 回答
593 浏览

sql - 用sql过滤掉偏差记录

我们有这组数据,我们需要获得一列的平均值。aselect avg(x) from y可以解决问题。然而,我们需要一个更准确的数字。

我认为必须有一种方法可以过滤具有太高或太低值(尖峰)的记录,以便我们可以在计算平均值时将它们排除在外。

0 投票
3 回答
1793 浏览

logging - 分析 log4net 日志的工具

是否有可用于分析 log4net 日志的工具。

特别是我想通过线程ID提取两个方法调用并分析两者之间的持续时间,以创建一些调用持续时间的统计信息。

再加上多个(100x10Mb)文件。

我想grep也会这样做。

0 投票
1 回答
105 浏览

performance - 有哪些应用程序可以在生成数据时传递数据并让它分析一些统计数据?

基本要求是从 C# 代码(托管代码或可以从命令中定期获取数据的东西)传递给某些命令类型和执行时间(可能还有其他数据,但这是我们目前关注的基本数据) line. 并对其进行一些统计分析:每种命令类型的平均时间、标准偏差、一些图表会很好,等等。

可以实时执行此操作的东西可能更可取,但我想我们自己保存数据并将其传递给分析也是可以接受的。

我们可以为此写一些东西,但似乎应该有一些东西可以用于此。

编辑:基本上是在寻找低学习曲线并且能够做上面提到的事情。基本上比手动编码更快学习和使用的东西。

0 投票
11 回答
37199 浏览

google-analytics - 如何解码谷歌 gclids

现在,我意识到对此的最初反应可能是“你不能”或“使用分析”,但我会继续希望有人比这更有洞察力。

带有“自动标记”的 Google 广告词会在链接上附加一个“gclid”(可能是“google click id”),将您发送到广告网站。它出现在网络日志中,因为它是一个查询参数,分析使用它来将该访问与广告/活动联系起来。

我想做的是从 gclid 中提取任何有用的信息,以便对我们的流量进行我们自己的分析。原因如下:

  • 统计数据是不完善的,但如果我们对它们进行整理,我们就会确切地知道我们做了什么假设,以及它们是如何计算的。
  • 我们可以将数据与其他数据联系起来,并生成更准确的转化​​率统计数据。
  • 我们不必依赖 javascript 进行转换。

现在很明显 gclid 是 base64 编码的(或一些接近的变体),它的某些部分比其他部分变化更大。除此之外,我无法确定它与什么有关。

有没有人对我如何解码这个有任何见解,或者是否有人已经将 gclids 关联回了compaigns 甚至帐户​​?

我和谷歌的几个人谈过,尽管他们有“不作恶”的座右铭,但他们完全不愿意讨论泄露这些信息的可能性,即使是在保密协议下。似乎他们喜欢他们对我们的网络统计数据的垄断。

0 投票
2 回答
1131 浏览

performance - 在 IIS6 应用程序池上查看特定于进程的性能统计信息的可靠方法

在 Windows Server 2003 的 perfmon 中,有一些计数器对象可以获取每个进程的处理器时间和内存工作集统计信息。唯一的问题是,在具有多个应用程序池的环境中,没有办法可靠地识别正确的工作进程。在perfmon中,它们都被称为“w3wp”,如果有多个,它们是w3wp、w3wp#1、w3wp#2,以此类推。即使这些名称也不可靠 - 数量取决于哪个最先启动,并且在应用程序池被回收时显然会发生变化,因为进程被破坏并重新启动。

我没有找到任何特定于 ASP.NET 的计数器,并且由于某种原因,我的 IIS 对象没有分隔实例——只有一个“全局”实例。

最终,我只想要特定 IIS 应用程序池的“% Processor Time”和“Working Set”计数器。有什么建议么?

0 投票
3 回答
4718 浏览

language-agnostic - 计算 n iid 指数随机变量之和的 95% 置信区间

事实上,让我们推广到一个c置信区间。设公共速率参数为a。(请注意,具有速率参数的指数分布的均值a1/a。)

首先找到n此类 iid 随机变量之和的 cdf。使用它来计算c总和的置信区间。请注意,总和的最大似然估计 (MLE) 是n/a,即,n乘以单次平局的平均值。

背景:这出现在我正在编写的一个程序中,该程序通过随机样本进行时间估计。如果我根据泊松过程抽取样本(即样本之间的间隙呈指数分布)并且n它们发生在活动 X 期间,那么对活动 X 的持续时间有什么好的估计?我很确定答案就是这个问题的答案。

0 投票
3 回答
521 浏览

statistics - 网络使用统计

什么是检查当前 Web 使用统计数据的好网站——尤其是 Java 版本、操作系统、浏览器。我一直在试图找出谷歌时代精神,因为它应该有这些信息,但我找不到。

0 投票
10 回答
56532 浏览

math - 将多项式拟合到数据

给定一组值(x,f(x)),有没有办法找到最适合数据的给定度数的多项式?

我知道多项式插值,它用于查找n给定n+1数据点的次数多项式,但是这里有大量值,我们想找到一个低次数多项式(找到最佳线性拟合、最佳二次、最佳三次等)。 )。它可能与最小二乘有关......

更一般地说,我想知道当我们有一个多元函数时的答案——比如说(x,y,f(x,y)),点——并且想要p(x,y)在变量中找到给定次数的最佳多项式 ( )。(特别是多项式,而不是样条或傅里叶级数。)

理论和代码/库(最好是 Python,但任何语言都可以)都会很有用。