问题标签 [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将 data.frame 从宽格式重塑为长格式
我很难将我data.frame
的从宽表转换为长表。目前它看起来像这样:
现在我想把它data.frame
变成一个 long data.frame
。像这样的东西:
正如一些人在类似问题中所建议的那样,我已经查看并尝试过使用melt()
和功能。reshape()
但是,到目前为止,我只得到混乱的结果。
如果可能的话,我想用这个reshape()
函数来做,因为它看起来更好处理一些。
r - 使用来自不同数据帧的内容来操作数据帧,类似于 SQL 连接
假设我有一个包含内容的数据框:
和另一个包含内容的数据框:
我想根据第二个的适当值修改原始帧。我可以用任何其他语言或 SQL 轻松地做到这一点,而且我确信我可以使用 for 循环和什么来管理,但是对于我在 R 中看到的所有其他内容,我猜它有特殊的语法可以做到这一点-衬垫。那么,如果是这样,怎么办?如果没有,您能否展示如何使用循环来完成。我实际上还没有开始学习 R 中的循环,因为它具有惊人的功能,可以简单地提取和操作任何值。
作为参考,输出将:
r - 对数据框中的列执行二进制函数
假设我有一个包含内容的数据框:
我想把它改造成
我可以很容易地做到
通过做d$day=d$trial<3
,但我怎样才能得到我想要的?
r - R中的向量与数据框
R中的向量和数据框有什么区别?在什么情况下应该将向量转换为数据帧?
r - 如何将数据框列转换为数字类型?
如何将数据框列转换为数值类型?
r - 将可变长度数据存储在 R data.frame 中的最佳方法?
我有一些混合类型的数据,我想将它们存储在某种 R 数据结构中。每个数据点都有一组固定属性,可以是一维数字、因子或字符,还有一组可变长度数据。例如:
实际值并非都可以相互计算,但这就是数据的特点。我要做的操作包括基于布尔函数对数据进行子集化(例如类似nchar(data$phrase) > 10
or lapply(data$token_lengths, length) > 2)
。我还想按索引对可变长度部分中的值进行索引和平均值。这不起作用,但是喜欢:mean(data$token_lengths[1], na.rm=TRUE))
我发现我可以通过将“token_lengths”设置为数组来将其塞入 data.frame:
但这是最好的方法吗?
r - 如何在 data.frame 中引用 data.frame 的列?
我有一个名为 series_to_plot.df 的 data.frame,它是通过将许多其他 data.frames 组合在一起创建的(如下所示)。我现在只想从其中的每一个中提取 .mm 列,以便绘制它们。所以我想拉出每个data.frame的第3列(例如p3c3.mm,p3c4.mm等......),但我看不到如何在不循环的情况下对对象中的所有data.frames执行此操作名字。这可能吗?
我可以只提取一组:例如 series_to_plot.df[[3]] 和 series_to_plot.df[[10]] 的另一个(所以它只是一个向量列表..),我可以直接使用 series_to_plot.df$ 引用p3c3.mm,但是是否有命令从每个 data.frame 中获取包含所有 mm 的向量?我期待这样的索引可以工作: series_to_plot.df[,3[3]] 但它返回错误[.data.frame
(series_to_plot.df, , 3[3]) : undefined columns selected
list - 按列表对 data.frame 进行子集,并按行对每个部分应用函数
这似乎是一个典型的plyr
问题,但我有不同的想法。这是我要优化的功能(跳过for
循环)。
现在是一个简短的演示……实际上,我将解释我主要打算做什么。我想通过对象中data.frame
收集的向量对 a 进行子集化。list
由于这是心理研究中伴随数据处理的函数代码的一部分,因此您可以将其视为m
人格问卷(10 个主题,20 个变量)的结果。列表中的向量包含定义问卷子量表(例如人格特征)的列索引。每个子量表由几个项目(中的列data.frame
)定义。如果我们假设每个分量表上的分数只不过sum
是行值(或其他一些函数)(每个主题的问卷那部分的结果),你可以运行:
我看了一眼这个函数,我必须承认这个小循环根本没有破坏代码......但是,如果有更简单/有效的方法,请告诉我!
r - 如何在 R 中将两个 data.frames 合并在一起,参考查找表
我正在尝试data.frames
根据每个名为series_id
. 这是我的合并声明:
我得到的错误是
as.vector(y) 中的错误:找不到对象“series_id”
帮助给出了这个描述,但我不明白为什么它找不到series_id
. 示例数据如下。
r - 如何在R中获取行索引号?
假设我在 R 中有一个列表或数据框,我想获取行索引,我该怎么做?也就是说,我想知道某个矩阵由多少行组成。