问题标签 [r]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
6739 浏览

r - 向量化我的想法:R 中的向量运算

所以早些时候我回答了我自己关于在 R 中思考向量的问题。但现在我遇到了另一个我无法“向量化”的问题。我知道向量更快,循环更慢,但我不知道如何在向量方法中做到这一点:

我有一个数据框(出于情感原因,我喜欢将其称为 my.data),我想对其进行全面的边际分析。我需要一次删除某些元素并对数据框“赋值”,然后我需要通过仅删除下一个元素来再次进行迭代。然后再做一次……再一次……这个想法是对我的数据子集进行全面的边际分析。无论如何,我无法想象如何以矢量有效的方式做到这一点。

我已经缩短了代码的循环部分,它看起来像这样:

所以很明显我在中间砍掉了一堆东西,只是为了让它不那么笨拙。目标是使用更有效的向量来删除 j 循环。有任何想法吗?

0 投票
3 回答
923 浏览

r - R是编译语言吗?

我在网络上的任何地方都找不到它(我不想安装它)。R语言是编译语言吗?它运行预先编写的脚本的速度有多快?它是否进行任何类型的编译,或者只是逐行执行指令?

0 投票
1 回答
328 浏览

r - 转换 12-okt-2007 形式的本地化日期

我已导入具有以下格式日期的时间序列:

这产生:

由于 May 已被翻译,因此显然将语言环境考虑在内。

根据文档, %b 应该是月份的缩写名称,但我想那里可能存在一些问题。

我将如何解决这个问题?

我在 Linux t2.6.27-9-generic #1 SMP 下运行 R


更新:深入挖掘我发现问题出在 LC_TIME 定义中,其中适当的缩写形式为:

而我的数据包含:

我想我可以考虑对数据进行预处理,但是在 R 中进行此操作的平滑方式将是最受欢迎的。


这有点工作,但不是那么优雅:

谢谢!

0 投票
4 回答
12431 浏览

r - 在 R 中过滤数据

我有一个 CSV 的数据文件,我可以使用它在 R 中加载read.csv()

一些数据丢失了,所以我想将数据框减少到完全由非缺失数据组成的集合,即如果 aNULL出现在任何地方,我想从过滤的数据集中排除该列和行。

我知道我可以通过内置的 R 向量操作相当简单地做到这一点,但我不太确定如何准确地做到这一点?

为了让我的问题更具体一点,这里有一个数据的快速示例,这样你就可以看到我想要做什么。

所以给定这个输入,我需要一些代码来减少输出。

AsAnno8是唯一具有非 NULL 数据的列,并且只有四行具有非 NULL 数据。

0 投票
2 回答
626 浏览

r - 以 08:00-08:15 等时间间隔运行

我想导入一个时间序列,其中第一个字段表示一个时期:

R 是否有任何功能可以巧妙地做到这一点?

谢谢!


更新:

正如 Godeke 所建议的那样,我发现的最有希望的解决方案是 cron 包并使用 substring() 来提取间隔的开始。

我仍在处理相关问题,所以当我到达那里时,我会更新解决方案。

0 投票
5 回答
2176 浏览

visual-studio - 在 Visual Studio 安装项目中安装 100 个文件的最简单方法是什么

我有一个标准的 c# 应用程序,它充当“R”统计引擎的 GUI 前端。“R”由大约 50 个不同文件夹中的大约 600 个文件组成,可以通过 xcopy 部署在机器上“安装”。

我想将 R 引擎和我的 c# gui 打包到一个 setup.exe 中,这样用户就不需要先安装 R,然后再安装我的 c# 应用程序。

我知道我可以制作一个安装项目,然后一个一个地添加 R 文件,但是添加所有 600 个文件将非常乏味!

有没有更简单的方法来做我想做的事?我可以添加单个R文件夹并自动添加子文件夹和文件以节省我将它们一一添加吗?或者也许在我的设置项目中执行一个解压缩过程,这将一次性解压缩 R 引擎?

0 投票
6 回答
2137 浏览

r - 如果您已经熟悉 R,学习 SAS 的资源

我想学习一些 SAS,因为我对一些倾向于专门使用它的行业感兴趣。但是,我不想陷入假设我对统计编程一无所知的资源。对于具有 R 统计经验的程序员,是否有很好的指南?

谢谢,史蒂文

0 投票
1 回答
2225 浏览

r - 具有多个时间序列的 csv 文件

我已经导入了一个包含大量数据列和部分的 csv 文件。

文件的布局是这样的:

(不同数据集的标题完全相同。

现在,我可以绘制第一个数据集:

我很好奇是否有更好的方法:

  1. 无需转换即可将所有数字读取为数字。

  2. 以某种有意义的方式处理文件中的不同数据集。

任何提示将不胜感激。谢谢你。


状态更新:

我还没有在 R 中真正找到一个好的解决方案,但是我已经开始在 Lua 中编写一个脚本来将每个单独的时间序列分成一个单独的文件。我暂时将其保持打开状态,因为我很好奇 R 将如何处理所有这些文件。我每天会收到 8 个文件。

0 投票
6 回答
6206 浏览

r - R 是否有像 Perl 的 qw() 这样的类似引号的运算符?

任何人都知道 R 是否有类似 Perl 的类似引号的运算符qw()来生成字符向量?

0 投票
2 回答
1057 浏览

r - 为 BRCAPRO 癌症基因风险计算引擎编写 GUI

我认为这是 Stack Overflow 上一个完全独特的问题。首先是一些背景:

我被要求在名为 BRCAPRO (brack-a-pro) 的计算引擎之上编写一个新的 GUI。BRCAPRO 基于名为 BayesMendel 的软件实现了孟德尔计算模型。BRCAPRO 计算被专门从事癌症治疗的医生和外科医生用来向患者展示:

  • 根据他们的遗传和家族史被诊断出患有癌症的可能性。
  • 基于不同治疗形式和/或这些治疗开始年龄的预期寿命变化。

我已经做了足够的研究,知道 BRCAPRO 公式太复杂了,无法在我自己的代码中合理地实现。

现有一个众所周知的(癌症医生)软件包,称为 CancerGene:http ://www8.utsouthwestern.edu/utsw/cda/dept47829/files/65844.html 。这个程序很旧,在 Windows 95 上运行,包括计算引擎,用于我的客户端无法使用的几种癌症。理想情况下,我的客户希望他的应用程序在网络上运行,以便他可以轻松地与其他医生共享信息。

我的任务是使用基于 BRCAPRO 引擎的 CancerGene 应用程序,并且:

  1. 复制 90% 的功能
  2. 删除不必要的功能
  3. 修改报告的输出
  4. 如果可能,使其基于网络

现在我的问题:

有人知道如何针对 BRCAPRO 进行编码吗?我用 Google 搜索了两天,没有发现任何 API 文档或开发信息。维基百科说 BayesMendel 建模软件是用 R 编写的,但我不知道 BRCAPRO 是用什么编写的。我对 R 一无所知。

需要说明的是,我不需要修改 BRCAPRO 的行为或计算引擎。我只需要知道如何输入它,以便它返回数字给我。

-- 编辑以添加更多信息 --

我在上面的链接中下载了 CancerGene 应用程序并安装了它。有少量文档,包括 BRCAPRO 期望接收的数据格式。在不涉及不必要的细节的情况下,BRCAPRO 需要矩阵格式的数据,其中每一列代表一个遗传特征,每一行代表一个家庭成员。现在,我只需要知道从 Web/Windows 表单中收集到该矩阵后如何将其传递给 BRCAPRO 引擎。

希望 Stack Overflow 上有几个医生/开发人员!

KN