问题标签 [sapply]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的平均列对
我想平均数据集中的列对,而不是移动平均线。我想将列分成两组,并找到每对的平均值。
我展示了一个样本数据集、所需的结果以及返回所需结果的嵌套 for 循环。我只是认为可能有更好的方法。抱歉,如果我在其他帖子中忽略了解决方案。我确实在这里搜索过,但我没有像通常尝试的那样勤奋地搜索互联网。谢谢你的任何建议。
r - sapply 无法正确处理日期
可能重复:
为什么 mapply 不返回日期对象?
我遇到了以下奇怪的问题,当我转换一个字符串时我没有问题:
as.Date(alldays[1])
但是,当我使用 sapply 或 lapply 时,我得到了一个很大的负数,有人知道为什么会这样吗?谢谢!
大家好,我找到了问题,非常感谢您的帮助!
r - 跨数据帧计算字符串中的特定字符。应用
我在这里发现了与此类似的问题: Count the number of words in a string in R? 在这里 使用 R 更快地分割字符串和计数字符的方法? 但我无法在我的示例中工作。我有一个相当大的数据框。其中一列具有特征的基因组位置,并且条目的格式如下:
我将这些元素拆分为单独的元素以获得以下内容(即,第一个条目):
但在第四个条目的情况下,我想将其粘贴到两个单独的位置。IE
变成
(相邻列中的所有相关数据均从原始数据中填写)
我确定哪些行需要此操作的一种简单方法是简单地计算带有逗号“,”的行,因为它们不会出现在任何其他列的任何其他文本中,除非该特征有多个基因组位置。但是,我在第一个障碍中失败了,因为 sapply 命令错误地为每个条目返回“1”。
(或者)
使用我上面发布的示例,我希望输出为
实际上在做
在命令行中的相同数据上显示我有 10 个包含“,”的条目。
使用我上面发布的示例,我希望输出为
所以最初我想让这个工作,但我也有点难以理解如何提取两个(或更多)位置并将它们放在自己的行上,填充相邻的数据。实际上我的意图是坚持我知道的东西(在命令行上)用','out grepping行,复制文件并拆分和awk选定的列(各个文件中的第一个和第二个位置)然后cat和sort他们。如果我在 R 中有更好的方法来做到这一点,那么我会喜欢一个指针。
r - 使用“应用”系列函数处理 data.frames 列表
我有一个数据框,然后将其拆分为三个(或任意数量)的数据框。
我要做的是自动处理每个数据框中的每一列并添加现有变量的滞后版本。
例如,如果每个 data.frame 中有三个变量(V1、V2、V3),我想自动(没有硬编码)添加 V1.lag、V2.lag 和 V3.lag。
这是我到目前为止所拥有的,但我现在被困住了。
任何帮助都会受到高度赞赏。
最后,我想将三个数据框合并为一个大数据框,其中将包含新创建的变量。
任何帮助将不胜感激。
编辑:在评论部分,我询问了移动平均线而不是滞后。这是解决方案:
r - 按组和列的加权平均值
我希望为几个(实际上是大约 60 个)列中的每一个按组获得加权平均值。这个问题非常类似于:在刚刚询问的数据框中重复应用 ave 计算组均值。
到目前为止,我已经提出了两种获得加权平均值的方法:
sapply
对每一列使用单独的语句- 在 a 中放置一个
sapply
语句for-loop
但是,我觉得必须有一种方法可以在语句中插入apply
语句,sapply
反之亦然,从而消除for-loop
. 我尝试了许多排列但没有成功。我也看了sweep
函数。
这是我到目前为止的代码。
很抱歉我最近的所有问题,并感谢您的任何建议。
编辑显示y3
r - 在数据框中自动创建派生变量
我有一个包含六个数值变量 V1、V2、V3 和 V1.lag、V2.lag、V3.lag 的数据框。
注意:我的真实数据集有更多变量,但我仅使用 3 进行说明!
我希望能够自动(无需硬编码)运行所有 V 变量(不是滞后变量)并通过将每个 V 变量与对应的滞后变量相除来创建 V1.over.V1.lag 变量。
提前致谢
**编辑:我想出了如何识别“原始”列和“滞后”列**
但我仍然不知道如何将所有原始因素与其滞后因素分开
会给我指数,但我如何将它们与滞后结合成新的因素?
不工作
r - sapply 使用自定义函数(一系列 if 语句)
我想运行一个查看两个向量的函数,根据两个向量中值的符号返回不同的值。我写了一个函数来比较两个值,但是我想在两个向量上运行它。所以我使用了 sapply,但我得到的结果与预期不同。
以下给出了预期(和期望)的结果:
结果:90、0、270、180
但是,当我尝试进行相同的比较时,但使用带有 sapply 的向量时,我得到了不同的结果:
结果:90、90、180、180。
我看不出有什么问题,所以请帮忙!
r - 返回一个数据框
我正在使用以下代码从文件中提取完整案例的数量:
然后,例如:
此代码返回:
但是,我希望它返回以下类型的数据框:
我不确定我做错了什么。谢谢!
r - 为什么我的 sapply 函数要构建一个整数向量?
我有两个相关的问题——我正在尝试正确地学习 R,所以我正在从 R 课程中做一些家庭作业。他们让我们编写一个函数来返回一个相关向量:
当函数运行时,它将相关值打印到标准输出。它打印的值精确到小数点后六位。所以我知道我得到了一个很好的价值new.correlation.
返回的向量不包括这些值。相反,它是按顺序排列的整数。
我不知道为什么sapply
将整数推入向量?我在这里想念什么?
核心结构我其实不太懂,多多少少是:
这在冗余方面似乎非常不像 R。提示?
r - 计算中位数时如何将 na.rm=TRUE 传递给 sapply?
我创建了一个带有 3 个变量的数据框“杀手”。尽管始终存在NA
值,但数据是数字的。
我的目标是计算 3 个变量中每一个的平均值。
这将返回:
我知道这个na.rm
论点是一种忽略NA
价值观的手段。由于na.rm = FALSE
存在于 R 返回的内容中,因此假设有一种方法可以TRUE
在上面的代码行中将其设置为。我尝试了一些变化:
我不确定我是否接近或者这是否会涉及嵌套函数,正如其他类似的(尽管在我可以看到的这种情况下最终没有帮助)关于 SO 的主题的帖子。例如 ,如何将 na.rm 作为参数传递给 tapply?, 忽略 sapply 函数中的 NA
当然,我可以只计算用于创建杀手的每个向量的平均值,但如果我的要求是可能的,那就更好了。