9

我正在构建一个需要计算数据集统计数据的网络应用程序。我需要计算数组的百分位数、平均值、众数和其他统计函数。

通常在 Python 中,我只会使用 scipy、numpy 或 nltk,它们有一个庞大的 stat 数组函数库。我可以利用任何红宝石宝石或库来做到这一点吗?

在没有任何现有库的情况下,是否有一种简单的方法可以在 Python 中进行数据处理,同时将我的应用程序保留在 Ruby/Rails 中?

4

6 回答 6

7

如果您真的需要一个完整的统计库,请查看statsample。否则,您可能会发现descriptive_statistics是一个不错的轻量级替代方案。

于 2012-11-26T07:16:37.023 回答
1

您也许可以使用RubystatsEasystats。我敢肯定还有更多我不知道的宝石。

于 2012-11-26T07:14:38.163 回答
0

对于数字运算, Narray是标准推荐。它的统计方法有求和、累积求和、乘积(乘元素)、累积产生、平均值、标准差、均方根、均方根差、最小值、最大值和中值。

它专门用于数字,据称比 Array 快 50 倍,内存效率更高。

于 2012-11-26T16:50:43.563 回答
0

如果您正在计算 ActiveRecord 模型的统计信息,那么您可能需要查看统计信息gem。

我还为statisticus添加了书签,它提供了 GNU-R 集成和SIRB以供在控制台中使用。

在 Rails 应用程序下运行 Python 的方法有很多种,但在 Ruby 库中找到所需的方法可能更容易。

于 2012-11-26T17:03:40.613 回答
0

我已经实现了一个新的 Gem - MDArray,它在 JRuby 中进行统计。这对于 Web 应用程序来说实际上可能非常好,因为 JRuby 基本上是 Java。MDArray 遵循 NArray 和 Numpy 哲学,尽管在这一点上它可能比两者都慢,但它应该比纯 Ruby 替代品更快。

检查一下,如果您需要任何帮助,我将很乐意尝试并提供帮助。

干杯,

罗德里戈

于 2013-05-28T14:57:57.767 回答
0

您可以使用NMatrix,它是一个类似于 NumPy 的数值库,在不断开发中。(免责声明:我来自 SciRuby/NMatrix 团队)

于 2014-04-19T00:36:45.783 回答