我想知道 Apache Commons Math 中的所有操作是否都在内存操作中。我对 OLSMultipleLinearRegression 并将其用于大数据特别感兴趣。
还有任何现有的 JAVA API 可用于对大数据运行回归。
我想知道 Apache Commons Math 中的所有操作是否都在内存操作中。我对 OLSMultipleLinearRegression 并将其用于大数据特别感兴趣。
还有任何现有的 JAVA API 可用于对大数据运行回归。
我对该类的 javadocs 的阅读是它OLSMultipleLinearRegression
完全在内存中。首先,模型和样本数据必须作为原始数组提供,这排除了任何不适合内存的表示的可能性……至少在您提供输入的时候。
OLSMultipleLinearRegression
将完整的设计矩阵存储在内存中是正确的。但是,在同一个 Commons Math 包(3.0 版以后)中还有另一个 OLS 实现类, MillerUpdatingRegression
它不会将输入数据集存储在内存中。