问题标签 [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将数字日期值从 CSV 文件读取到“R”中的 data.frame
在上面的示例中,如何获取D[,1]
要读取的数据并将其存储为日期值:2010-03-16、2010-03-17、2010-03-18?我有很多这种格式的数据文件。
TIA,
r - R:如何写出 data.frame 以便我可以将其粘贴到 SO 中供其他人阅读?
我有一个大的data.frame,在绘制时显示了一些奇怪的属性。我想在 Stackoverflow 上问一个关于它的问题,为此我想以一种可以将其粘贴到 SO 中的形式写出 data.frame,其他人可以轻松运行它并将其放回再次 data.frame 对象。有没有简单的方法来实现这一点?另外,如果真的很长,我应该使用粘贴箱而不是直接粘贴在这里吗?
r - 将 data.frame 列名传递给函数
我正在尝试编写一个函数来接受一个 data.frame ( x
) 和一个column
来自它的。该函数对 x 执行一些计算,然后返回另一个 data.frame。我坚持将列名传递给函数的最佳实践方法。
以下两个最小示例fun1
产生fun2
了所需的结果,能够对 执行操作x$column
,max()
以示例为例。然而,两者都依赖于看似(至少对我而言)不优雅
- 打电话给
substitute()
并且可能eval()
- 需要将列名作为字符向量传递。
例如,我希望能够将该函数称为fun(df, B)
。我考虑过但未尝试过的其他选项:
column
作为列号的整数传递。我认为这可以避免substitute()
. 理想情况下,该函数可以接受任何一个。with(x, get(column))
,但是,即使它有效,我认为这仍然需要substitute
- 使用
formula()
andmatch.call()
,这两个我都没有太多经验。
子问题:是do.call()
首选eval()
吗?
r - 汇总数据框中的分组记录
我在 R 中有一个如下所示的数据框:
我想把它转换成
试图把它变成英文,我想将具有相同“源”的连续记录分组在一起,然后每组打印出一条记录,显示该组中的最高时间偏移、源以及该组中长度的总和.
TimeOffset 值将始终增加。
我怀疑这在 R 中是可能的,但我真的不知道从哪里开始。在紧要关头,我可以将数据框导出并在例如 Python 中执行,但如果可能的话,我更愿意留在 R 中。
提前感谢您提供的任何帮助
r - 从数据框中删除所有值为 NA 的列
我在使用数据框时遇到了问题,我自己无法真正解决该问题:数据框
具有任意属性作为列,每一行代表一个数据集。
问题是:
如何摆脱所有行的值为 NA的列?
select - 总结 R 中数据框中的分组记录(...再次)
(我今天早些时候试图问这个问题,但后来意识到我过度简化了问题;我收到的答案是正确的,但由于我对原始问题中的问题过度简化,我无法使用它们。这是我的第二次尝试...)
我在 R 中有一个数据框,如下所示:
我想将其转换为:
试图把它变成英文,我想将具有相同“源”和“目标”的连续记录分组在一起,然后每组打印出一条记录,显示该组的 StartTime、EndTime 和 Duration (=EndTime-StartTime),以及该组的长度总和,以及该组中内容的串联(都将是字符串)。
TimeOffset 值将始终在整个数据帧中增加。
我查看了 melt/recast 并感觉它可以用来解决问题,但无法理解文档。我怀疑在 R 中可以做到这一点,但我真的不知道从哪里开始。在紧要关头,我可以将数据框导出并在例如 Python 中执行,但如果可能的话,我更愿意留在 R 中。
提前感谢您提供的任何帮助
r - 基于向量向数据框添加几个变量
我相信这很容易 - 但我现在无法弄清楚。
基本上:我有一个很长的变量向量:
我有一些数据,我现在需要添加变量。我可以做:
但由于我的清单很长,我想要一个自动化的解决方案。这行不通。
我想要这个的原因是我需要垂直合并到数据框,其中一个没有它应该拥有的所有变量。
提前致谢
r - 在 R 中选择 data.frame 的前 4 行
如何选择 a 的前 4 行data.frame
:
r - 是什么让这两个 R 数据帧不相同?
我有两个小数据框,this_tx
和last_tx
. 在我能说的每一个方面,它们都是完全相同的。 this_tx
==last_tx
产生一个尺寸相同的框架, all TRUE
。 this_tx %in% last_tx
, 二TRUEs
. 目测,明显一模一样。但是当我打电话
identical(this_tx, last_tx)
我得到一个FALSE
. 有趣的是,甚至
identical(str(this_tx), str(last_tx))
将返回一个TRUE
. 如果我设置this_tx <- last_tx
,我会得到一个TRUE
。
到底是怎么回事?我对 R 的内部机制没有最深入的了解,但我找不到两个数据帧之间的单一区别。如果相关,帧中的两个变量都是因素 - 相同的级别,级别的相同数字编码,都只是相同原始数据帧的子集。将它们转换为字符向量没有帮助。
背景(因为我也不介意在这方面提供帮助):我有给予患者药物治疗的记录。每个治疗记录基本上都指定了一个人和一个日期。第二个表记录了在特定治疗期间给予的每种药物和剂量(通常,每次治疗给予几种药物)。我试图确定该人以相同剂量服用相同药物组合的连续时期。
我想出的最好的计划是按时间顺序检查治疗。如果治疗[i]的药物和剂量组合与治疗[i-1]的组合相同,则治疗[i]与治疗[i-1]处于同一阶段。当然,如果我不能比较药物/剂量组合,那就对了。
function - 在自定义函数中存储值
我的程序需要一个 data.frame 并处理数字。在某一时刻,来自第 j 列的值乘以预定义的值,该值取决于列名(实际上是物种名称 - 它是生态索引)。到目前为止,我一直在通过第二个 data.frame 通过匹配列名来提供这些值。在函数中集成固定变量值的有效方法是什么?我希望我的程序尽可能便携,而不需要第二个 data.frame 文件。
编辑
这就是功能。我正在尝试改进第二行(索引 <- read.table...),使其不依赖于外部资源。
我尝试过的另一个解决方案,虽然它可能看起来不太漂亮,但它完成了工作。我使用 dput(index) 并创建一个永久对象,然后将其插入到我的函数中。