我正在构建一个需要计算数据集统计数据的网络应用程序。我需要计算数组的百分位数、平均值、众数和其他统计函数。
通常在 Python 中,我只会使用 scipy、numpy 或 nltk,它们有一个庞大的 stat 数组函数库。我可以利用任何红宝石宝石或库来做到这一点吗?
在没有任何现有库的情况下,是否有一种简单的方法可以在 Python 中进行数据处理,同时将我的应用程序保留在 Ruby/Rails 中?
我正在构建一个需要计算数据集统计数据的网络应用程序。我需要计算数组的百分位数、平均值、众数和其他统计函数。
通常在 Python 中,我只会使用 scipy、numpy 或 nltk,它们有一个庞大的 stat 数组函数库。我可以利用任何红宝石宝石或库来做到这一点吗?
在没有任何现有库的情况下,是否有一种简单的方法可以在 Python 中进行数据处理,同时将我的应用程序保留在 Ruby/Rails 中?
如果您真的需要一个完整的统计库,请查看statsample。否则,您可能会发现descriptive_statistics是一个不错的轻量级替代方案。
如果您正在计算 ActiveRecord 模型的统计信息,那么您可能需要查看统计信息gem。
我还为statisticus添加了书签,它提供了 GNU-R 集成和SIRB以供在控制台中使用。
在 Rails 应用程序下运行 Python 的方法有很多种,但在 Ruby 库中找到所需的方法可能更容易。
我已经实现了一个新的 Gem - MDArray,它在 JRuby 中进行统计。这对于 Web 应用程序来说实际上可能非常好,因为 JRuby 基本上是 Java。MDArray 遵循 NArray 和 Numpy 哲学,尽管在这一点上它可能比两者都慢,但它应该比纯 Ruby 替代品更快。
检查一下,如果您需要任何帮助,我将很乐意尝试并提供帮助。
干杯,
罗德里戈
您可以使用NMatrix,它是一个类似于 NumPy 的数值库,在不断开发中。(免责声明:我来自 SciRuby/NMatrix 团队)