如果我想使用太大而无法放入内存的矩阵进行大量数据拟合,我会研究哪些工具/库?具体来说,如果我通常使用 php+mysql 从网站上运行数据,你会如何建议制作一个可以在合理时间内运行大型矩阵运算的离线进程?
可能的答案可能是“你应该使用这种语言和这些分布式矩阵算法在许多机器上映射 reduce”。我想 php 不是最好的语言,所以流程更像是其他一些离线进程从数据库中读取数据,进行学习,并以 php 以后可以使用的格式存储规则(因为网站的其他部分是用 php 构建的)。
不确定这是否是问这个问题的正确地方(会在机器学习 SE 中问它,但它从未退出测试版)。