13

我正在开发一个 Web 应用程序,我想执行两种统计/建模操作。

(1) 对存储在我的应用程序后端(HBase 集群)中的数据进行批量分析。通常,此操作需要定期执行,例如每晚。数据的大小可能会超过本地内存可以存储的大小,因此这可能需要调用一些支持并行计算的包。(2) 在前端由用户请求触发的动态 R 执行。典型用例包括小时间序列的预测。用户可能会同时发出请求,因此应该有一些对并发的支持。性能至关重要,因为用户不能无限期地等待响应的到来。

我的问题是:解决这两个问题的技术/CRAN 包的最佳组合是什么?我目前的想法是:

  • 将 Rserver 与 Ruby 客户端结合使用。或者,我正在考虑用 Java 编写自己的服务器并使用现有的 R/Java 绑定。
  • 使用 RHadoop 处理大型数据集上的作业。

我看到 RevoDeployR 是一个很棒的工具,但不是开源的,不是吗?

谢谢您的帮助

4

3 回答 3

5

我建议将 RApache ( http://rapache.net /) 与 R 包 RJSONIO 或 rjson 一起使用

于 2012-10-22T10:05:58.150 回答
4

看看Rook 包。它可以将任何 R 会话转换为 Web 服务器。它非常简单,事实上,在 Rapache 中使用。

编辑

自从我第一次回答以来,我已经开始使用shiny。它是一个很棒的包,用于创建具有高级 R 界面的动态、复杂、AJAX 驱动的网页,完全不需要或几乎不需要进入 HTML。

于 2012-10-22T10:10:39.850 回答
0

我尝试过 RStudio 的闪亮,它就像一个魅力

于 2015-10-29T08:22:28.303 回答