“dataframe”的相关标签问题

0 投票

1 回答

2035 浏览

r - 将数字日期值从 CSV 文件读取到“R”中的 data.frame

在上面的示例中，如何获取D[,1]要读取的数据并将其存储为日期值：2010-03-16、2010-03-17、2010-03-18？我有很多这种格式的数据文件。

TIA,

r csv formatting dataframe

2010-04-13T06:31:06.677

0 投票

4 回答

479 浏览

r - R：如何写出 data.frame 以便我可以将其粘贴到 SO 中供其他人阅读？

我有一个大的data.frame，在绘制时显示了一些奇怪的属性。我想在 Stackoverflow 上问一个关于它的问题，为此我想以一种可以将其粘贴到 SO 中的形式写出 data.frame，其他人可以轻松运行它并将其放回再次 data.frame 对象。有没有简单的方法来实现这一点？另外，如果真的很长，我应该使用粘贴箱而不是直接粘贴在这里吗？

r dataframe

2010-04-13T22:16:00.803

0 投票

7 回答

158570 浏览

r - 将 data.frame 列名传递给函数

我正在尝试编写一个函数来接受一个 data.frame ( x) 和一个column来自它的。该函数对 x 执行一些计算，然后返回另一个 data.frame。我坚持将列名传递给函数的最佳实践方法。

以下两个最小示例fun1产生fun2了所需的结果，能够对执行操作x$column，max()以示例为例。然而，两者都依赖于看似（至少对我而言）不优雅

打电话给substitute()并且可能eval()
需要将列名作为字符向量传递。

例如，我希望能够将该函数称为fun(df, B)。我考虑过但未尝试过的其他选项：

column作为列号的整数传递。我认为这可以避免substitute(). 理想情况下，该函数可以接受任何一个。
with(x, get(column))，但是，即使它有效，我认为这仍然需要substitute
使用formula()and match.call()，这两个我都没有太多经验。

子问题：是do.call()首选eval()吗？

r dataframe r-faq

2010-04-14T23:04:18.577

0 投票

3 回答

542 浏览

r - 汇总数据框中的分组记录

我在 R 中有一个如下所示的数据框：

我想把它转换成

试图把它变成英文，我想将具有相同“源”的连续记录分组在一起，然后每组打印出一条记录，显示该组中的最高时间偏移、源以及该组中长度的总和.

TimeOffset 值将始终增加。

我怀疑这在 R 中是可能的，但我真的不知道从哪里开始。在紧要关头，我可以将数据框导出并在例如 Python 中执行，但如果可能的话，我更愿意留在 R 中。

提前感谢您提供的任何帮助

r select dataframe

2010-04-15T04:43:10.477

0 投票

13 回答

139110 浏览

r - 从数据框中删除所有值为 NA 的列

我在使用数据框时遇到了问题，我自己无法真正解决该问题：数据框
具有任意属性作为列，每一行代表一个数据集。

问题是：
如何摆脱所有行的值为 NA的列？

r apply dataframe

2010-04-15T08:59:52.520

0 投票

3 回答

706 浏览

select - 总结 R 中数据框中的分组记录（...再次）

（我今天早些时候试图问这个问题，但后来意识到我过度简化了问题；我收到的答案是正确的，但由于我对原始问题中的问题过度简化，我无法使用它们。这是我的第二次尝试...）

我在 R 中有一个数据框，如下所示：

我想将其转换为：

试图把它变成英文，我想将具有相同“源”和“目标”的连续记录分组在一起，然后每组打印出一条记录，显示该组的 StartTime、EndTime 和 Duration (=EndTime-StartTime)，以及该组的长度总和，以及该组中内容的串联（都将是字符串）。

TimeOffset 值将始终在整个数据帧中增加。

我查看了 melt/recast 并感觉它可以用来解决问题，但无法理解文档。我怀疑在 R 中可以做到这一点，但我真的不知道从哪里开始。在紧要关头，我可以将数据框导出并在例如 Python 中执行，但如果可能的话，我更愿意留在 R 中。

提前感谢您提供的任何帮助

select r statistics dataframe

2010-04-15T13:20:27.273

0 投票

2 回答

3622 浏览

r - 基于向量向数据框添加几个变量

我相信这很容易 - 但我现在无法弄清楚。

基本上：我有一个很长的变量向量：

我有一些数据，我现在需要添加变量。我可以做：

但由于我的清单很长，我想要一个自动化的解决方案。这行不通。

我想要这个的原因是我需要垂直合并到数据框，其中一个没有它应该拥有的所有变量。

提前致谢

r dataframe

2010-04-17T19:03:01.470

0 投票

5 回答

418106 浏览

r - 在 R 中选择 data.frame 的前 4 行

如何选择 a 的前 4 行data.frame：

r dataframe

2010-04-19T13:21:25.217

0 投票

2 回答

2333 浏览

r - 是什么让这两个 R 数据帧不相同？

我有两个小数据框，this_tx和last_tx. 在我能说的每一个方面，它们都是完全相同的。 this_tx==last_tx产生一个尺寸相同的框架， all TRUE。 this_tx %in% last_tx, 二TRUEs. 目测，明显一模一样。但是当我打电话

identical(this_tx, last_tx)

我得到一个FALSE. 有趣的是，甚至

identical(str(this_tx), str(last_tx))

将返回一个TRUE. 如果我设置this_tx <- last_tx，我会得到一个TRUE。

到底是怎么回事？我对 R 的内部机制没有最深入的了解，但我找不到两个数据帧之间的单一区别。如果相关，帧中的两个变量都是因素 - 相同的级别，级别的相同数字编码，都只是相同原始数据帧的子集。将它们转换为字符向量没有帮助。

背景（因为我也不介意在这方面提供帮助）：我有给予患者药物治疗的记录。每个治疗记录基本上都指定了一个人和一个日期。第二个表记录了在特定治疗期间给予的每种药物和剂量（通常，每次治疗给予几种药物）。我试图确定该人以相同剂量服用相同药物组合的连续时期。

我想出的最好的计划是按时间顺序检查治疗。如果治疗[i]的药物和剂量组合与治疗[i-1]的组合相同，则治疗[i]与治疗[i-1]处于同一阶段。当然，如果我不能比较药物/剂量组合，那就对了。

r dataframe comparison

2010-04-22T00:53:54.827

0 投票

4 回答

538 浏览

function - 在自定义函数中存储值

我的程序需要一个 data.frame 并处理数字。在某一时刻，来自第 j 列的值乘以预定义的值，该值取决于列名（实际上是物种名称 - 它是生态索引）。到目前为止，我一直在通过第二个 data.frame 通过匹配列名来提供这些值。在函数中集成固定变量值的有效方法是什么？我希望我的程序尽可能便携，而不需要第二个 data.frame 文件。

编辑

这就是功能。我正在尝试改进第二行（索引 <- read.table...），使其不依赖于外部资源。

我尝试过的另一个解决方案，虽然它可能看起来不太漂亮，但它完成了工作。我使用 dput(index) 并创建一个永久对象，然后将其插入到我的函数中。

function r dataframe

2010-04-24T06:47:15.773

问题标签 [dataframe]

Reference