问题标签 [dataframe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
255185 浏览

r - 如何拆分数据框?

我想将一个数据框拆分为几个较小的数据框。这看起来像一个非常微不足道的问题,但是我无法从网络搜索中找到解决方案。

0 投票
3 回答
77838 浏览

r - 在 R 中,如何真正快速地遍历数据帧的行?

假设您有一个包含多行多列的数据框。

列有名称。您想按数字访问行,按名称访问列。

例如,一种(可能很慢)循环遍历行的方法是

另一种方法是为单独的列(如column1_list = df[["column1"])创建“列表”,并在一个循环中访问列表。这种方法可能很快,但如果您想访问许多列,也很不方便。

是否有一种快速循环数据框行的方法?其他一些数据结构是否更适合快速循环?

0 投票
2 回答
8518 浏览

data-structures - 在 R 中将矩阵转换为数据框的问题(R 认为所有数字类型都是因子)

我通过 COM 接口将数据从 C# 传递到 R。当数据到达 R 时,它被存放在一个“矩阵”中。我使用的一些函数要求数据位于“DataFrame”内。我使用转换数据结构

数据表达到 R 就好了,但是一旦我转换到 DataFrame,它假定我所有的数字数据都是因素!

所以它变成: {34, 46, 90, 54, 69, 54} 变成 {1, 2, 3, 4, 5, 4}

我的数据表确实有因素,所以我不能强迫整个事情都是数字的。有没有办法解决?注意:我无法将数据作为 CSV 导出到文件系统并手动将其读入 R。

附带说明一下,我正在使用的需要 DataFrame 的功能是使用的“Hmisc”包

这会为 DataFram 中的每一列数据生成频率直方图,并将它们全部排列成网格模式(非常漂亮)!

谢谢!-戴夫

0 投票
5 回答
15116 浏览

r - R:data.frame 的聚合列

我有一个看起来像这样的 data.frame

我想找到Memory列的平均值和列的平均值Naive。该aggregate函数聚合行。这data.frame可能有大量的行,因此转置然后aggregatecolnames原件应用data.frame让我觉得很糟糕,而且通常很烦人:

我错过了什么明显的东西?

0 投票
2 回答
1205 浏览

r - 使用 R 程序(例如)通过 write.table 将“.rtest”输出写入文件?

我正在使用 R 以特定的成对方式打开一些保存的 .csv 文件并执行统计测试(mantel.rtest在包“ade4”中找到)。.csv 文件按顺序命名为“fileAX”或“fileBY”,其中 X 和 Y 是整数。

我想将此测试的结果保存在一个文件中,但遇到了一些问题。

这是代码(请原谅“粘贴”的低效用法:

尝试执行此操作会导致以下错误消息:

我尝试使用“unlist”和“as.vector”等各种功能将“mantelout”转换为更友好的格式,但无济于事。有什么想法吗?

谢谢,哇

编辑:我应该注意,在 R 环境中这个测试的输出如下所示:

0 投票
2 回答
2005 浏览

r - R + reshape : data.frame 列的方差

我在 R 中使用 reshape 来计算 data.frame 列的聚合统计信息。这是我的data.frame:

这只是一个小测试 data.frame 来尝试理解 reshape 包。我融化,然后投射,试图找到as 和bs 的平均值:

啊!什么?希望平均值c(2,3)是 2.5 等等。这是怎么回事?这是一件事:

这是怎么回事?我5的两个都去哪儿了?我在这里有一个非常基本的误解吗?如果是这样:它是什么?

0 投票
7 回答
110151 浏览

r - 在数据框中用 NA 替换字符值

我有一个数据框,其中包含(在随机位置)一个"foo"我想用NA.

在整个数据框中这样做的最佳方法是什么?

0 投票
7 回答
6887 浏览

r - 在 R 中,df["x"] 和 df$x 有什么区别

我在哪里可以找到有关通过以下方式调用 data.frame 中的列之间的差异的信息:

它们都返回“相同”的结果,但不一定采用相同的格式。我注意到的另一件事是 df$x 返回一个列表。而 df["x"] 返回一个 data.frame。

编辑:但是,知道在哪种情况下使用哪个已成为一项挑战。这里是否有最佳实践,或者它真的归结为知道命令或功能需要什么?到目前为止,如果我的功能一开始不起作用(反复试验),我就一直在循环使用它们。

0 投票
6 回答
40485 浏览

r - 如何将 XTS 更改为 data.frame 并保留索引?

我有一个以下格式的 R 中的 XTS 时间序列,并且在导出为 CSV 以在另一个程序中工作之前尝试进行一些处理、子集和重新排列。

我想将其转换为 data.frame,以便我可以更轻松地操作它,然后导出到另一个程序。但是,当我使用test1 <- as.data.frame(master_1)test1 时,索引(即日期和时间)确实可见,

但是没有显示索引,

并且编写 csvwrite.csv(master_1, file="master_1.csv")不包括时间或日期。为什么会这样,我怎样才能将数据/时间数据作为一列包含在内,以便在其他 R 命令中使用并正确导出?

谢谢你的帮助。

0 投票
13 回答
402312 浏览

r - 当它们具有不同的列集时,按行组合两个数据帧(rbind)

是否可以行绑定两个没有相同列集的数据框?我希望保留绑定后不匹配的列。