问题标签 [dataframe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2035 浏览

r - 将数字日期值从 CSV 文件读取到“R”中的 data.frame

在上面的示例中,如何获取D[,1]要读取的数据并将其存储为日期值:2010-03-16、2010-03-17、2010-03-18?我有很多这种格式的数据文件。

TIA,

0 投票
4 回答
479 浏览

r - R:如何写出 data.frame 以便我可以将其粘贴到 SO 中供其他人阅读?

我有一个大的data.frame,在绘制时显示了一些奇怪的属性。我想在 Stackoverflow 上问一个关于它的问题,为此我想以一种可以将其粘贴到 SO 中的形式写出 data.frame,其他人可以轻松运行它并将其放回再次 data.frame 对象。有没有简单的方法来实现这一点?另外,如果真的很长,我应该使用粘贴箱而不是直接粘贴在这里吗?

0 投票
7 回答
158570 浏览

r - 将 data.frame 列名传递给函数

我正在尝试编写一个函数来接受一个 data.frame ( x) 和一个column来自它的。该函数对 x 执行一些计算,然后返回另一个 data.frame。我坚持将列名传递给函数的最佳实践方法。

以下两个最小示例fun1产生fun2了所需的结果,能够对 执行操作x$columnmax()以示例为例。然而,两者都依赖于看似(至少对我而言)不优雅

  1. 打电话给substitute()并且可能eval()
  2. 需要将列名作为字符向量传递。

例如,我希望能够将该函数称为fun(df, B)。我考虑过但未尝试过的其他选项:

  • column作为列号的整数传递。我认为这可以避免substitute(). 理想情况下,该函数可以接受任何一个。
  • with(x, get(column)),但是,即使它有效,我认为这仍然需要substitute
  • 使用formula()and match.call(),这两个我都没有太多经验。

问题:是do.call()首选eval()吗?

0 投票
3 回答
542 浏览

r - 汇总数据框中的分组记录

我在 R 中有一个如下所示的数据框:

我想把它转换成

试图把它变成英文,我想将具有相同“源”的连续记录分组在一起,然后每组打印出一条记录,显示该组中的最高时间偏移、源以及该组中长度的总和.

TimeOffset 值将始终增加。

我怀疑这在 R 中是可能的,但我真的不知道从哪里开始。在紧要关头,我可以将数据框导出并在例如 Python 中执行,但如果可能的话,我更愿意留在 R 中。

提前感谢您提供的任何帮助

0 投票
13 回答
139110 浏览

r - 从数据框中删除所有值为 NA 的列

我在使用数据框时遇到了问题,我自己无法真正解决该问题:数据框
具有任意属性作为列每一行代表一个数据集

问题是:
如何摆脱所有行的值为 NA的列?

0 投票
3 回答
706 浏览

select - 总结 R 中数据框中的分组记录(...再次)

(我今天早些时候试图问这个问题,但后来意识到我过度简化了问题;我收到的答案是正确的,但由于我对原始问题中的问题过度简化,我无法使用它们。这是我的第二次尝试...)

我在 R 中有一个数据框,如下所示:

我想将其转换为:

试图把它变成英文,我想将具有相同“源”和“目标”的连续记录分组在一起,然后每组打印出一条记录,显示该组的 StartTime、EndTime 和 Duration (=EndTime-StartTime),以及该组的长度总和,以及该组中内容的串联(都将是字符串)。

TimeOffset 值将始终在整个数据帧中增加。

我查看了 melt/recast 并感觉它可以用来解决问题,但无法理解文档。我怀疑在 R 中可以做到这一点,但我真的不知道从哪里开始。在紧要关头,我可以将数据框导出并在例如 Python 中执行,但如果可能的话,我更愿意留在 R 中。

提前感谢您提供的任何帮助

0 投票
2 回答
3622 浏览

r - 基于向量向数据框添加几个变量

我相信这很容易 - 但我现在无法弄清楚。

基本上:我有一个很长的变量向量:

我有一些数据,我现在需要添加变量。我可以做:

但由于我的清单很长,我想要一个自动化的解决方案。这行不通

我想要这个的原因是我需要垂直合并到数据框,其中一个没有它应该拥有的所有变量。

提前致谢

0 投票
5 回答
418106 浏览

r - 在 R 中选择 data.frame 的前 4 行

如何选择 a 的前 4 行data.frame

0 投票
2 回答
2333 浏览

r - 是什么让这两个 R 数据帧不相同?

我有两个小数据框,this_txlast_tx. 在我能说的每一个方面,它们都是完全相同的。 this_tx==last_tx产生一个尺寸相同的框架, all TRUEthis_tx %in% last_tx, 二TRUEs. 目测,明显一模一样。但是当我打电话

identical(this_tx, last_tx)

我得到一个FALSE. 有趣的是,甚至

identical(str(this_tx), str(last_tx))

将返回一个TRUE. 如果我设置this_tx <- last_tx,我会得到一个TRUE

到底是怎么回事?我对 R 的内部机制没有最深入的了解,但我找不到两个数据帧之间的单一区别。如果相关,帧中的两个变量都是因素 - 相同的级别,级别的相同数字编码,都只是相同原始数据帧的子集。将它们转换为字符向量没有帮助。

背景(因为我也不介意在这方面提供帮助):我有给予患者药物治疗的记录。每个治疗记录基本上都指定了一个人和一个日期。第二个表记录了在特定治疗期间给予的每种药物和剂量(通常,每次治疗给予几种药物)。我试图确定该人以相同剂量服用相同药物组合的连续时期。

我想出的最好的计划是按时间顺序检查治疗。如果治疗[i]的药物和剂量组合与治疗[i-1]的组合相同,则治疗[i]与治疗[i-1]处于同一阶段。当然,如果我不能比较药物/剂量组合,那就对了。

0 投票
4 回答
538 浏览

function - 在自定义函数中存储值

我的程序需要一个 data.frame 并处理数字。在某一时刻,来自第 j 列的值乘以预定义的值,该值取决于列名(实际上是物种名称 - 它是生态索引)。到目前为止,我一直在通过第二个 data.frame 通过匹配列名来提供这些值。在函数中集成固定变量值的有效方法是什么?我希望我的程序尽可能便携,而不需要第二个 data.frame 文件。

编辑

这就是功能。我正在尝试改进第二行(索引 <- read.table...),使其不依赖于外部资源。

我尝试过的另一个解决方案,虽然它可能看起来不太漂亮,但它完成了工作。我使用 dput(index) 并创建一个永久对象,然后将其插入到我的函数中。