问题标签 [na.rm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
265 浏览

r - 绘制绘图时缺少数据的警告 (R) - 但我正在使用 na.rm=TRUE

我试图更改箱线图的胡须(上限和下限)并被定向到boxplotperc()包中StatDA。我正在使用的数据缺少值,并且在使用常规时工作正常boxplot()

但是,当我使用该功能(即boxplotperc(x))时,我收到警告:

我尝试添加na.rm = TRUE到该函数,但返回相同的错误。作为R的新用户,我对上述错误的理解是应该允许“缺失值”,但显然这是不正确的。

关于如何boxplotperc()处理丢失的数据有什么建议吗?任何帮助都会很棒。谢谢你。

0 投票
0 回答
753 浏览

r - 使用 sapply 函数将多个函数应用于数据框的列

我有一个简单的小型数据集,我希望使用 sapply 函数将一组函数应用于数据框的每一列或变量。以下是来自 R 博客的代码

由于我是 R 的新手用户,我想知道,当数据丢失或 NA 值时,如何修改上述代码?例如:

工作正常,但为具有缺失值的变量产生 NA 值

但是,以下代码给了我以下错误消息:

获取错误(as.character(FUN),模式=“功能”,环境=环境):找不到模式“功能”的对象“乐趣”

非常感谢您的帮助!

0 投票
2 回答
6466 浏览

r - R:汇总多列(数字、字符)并删除 NA

我有一个包含许多列(〜50)的data.frame。其中一些是字符,一些是数字,其中 3 个用于分组。

我需要:

  • 从数字列中删除 NA
  • 计算每个数字列的平均值
  • 提取字符列的第一个元素

假设,我们正在使用修改后的虹膜数据,如下所示:

我总共有大约 50 列,数字和字符混合在一起。我一直在尝试类似的东西:

我得到的是组中所有列的含义,然后是相应组中具有第一个值的列。而且 NA 没有得到处理……这不是我所寻求的……

帮助任何人?

0 投票
2 回答
5212 浏览

r - Getting error in R trying to calculate mean on column that contains NA

From searching online and in this group, it seems like this should work:

However, what I get is:

This is the contents of that column in the dataset:

I'm sort of flustered.

0 投票
3 回答
92 浏览

r - na.rm 用于 R 中的其他值

我有一个数据框

并想计算它的平均值,但想排除异常值,在这种情况下为 -9999

有没有类似的命令

所以我可以去

请注意,我的 df if 600 x 50 dim

0 投票
2 回答
2433 浏览

r - rollapply na.rm = TRUE 给出 0 值而不是 NA

我有一个简单的问题,我似乎无法在 google、stackoverflow 或 stackexchange 上找到答案。我目前正在使用示例rollapply来查找包含 NA 的某些值的总和。例如:

这输出:

这看起来不错,但是,有两次连续有 3 个 NA。求和功能将 NA 交换为 0。不幸的是,这不适用于我将要使用的数据,因为 0 是一个有意义的值。有没有办法再次用 NA 替换 0?

我正在寻找如下输出:

先感谢您!

0 投票
1 回答
101 浏览

r - 使用 mapply 时忽略 NA

我有以下数据集:

我正在使用下面的代码来转换纬度和经度以使用以下代码获取位置:

但我收到以下错误: Error: is.numeric(location) && length(location) == 2 is not TRUE

请让我知道我哪里出错了。

0 投票
3 回答
6871 浏览

r - R中的NA值问题

我觉得这应该很容易,我已经看过互联网,但我不断收到错误消息。我过去做过很多分析,但对 R 和编程很陌生。

我有一个非常基本的函数来计算 x 列数据的平均值:

我在 RStudio 中并使用包含的“空气质量”数据集对其进行测试。当我加载 AQ 数据集并运行我的函数时:

我回来了:

NA NA 9.957516 77.882353 6.993464 15.803922

因为 AQ 中的前两个变量中有 NA。克,酷。我想抑制 NA,以便 R 将忽略它们并运行该函数。

我正在阅读我可以使用 na.rm=TRUE 指定它,例如:

但是当我这样做时,我收到一条错误消息:

“列均值错误(空气质量,na.rm = TRUE):未使用的参数(na.rm = TRUE)”

我正在阅读所有我只需要包含 na.rm = TRUE 的地方,该函数将运行并忽略 NA 值......但我不断收到这个错误。我也尝试过 use = "complete" 和我能找到的任何其他东西。

两个警告:

我知道我可以使用 is.na 创建一个向量,然后对数据进行子集化,但我不想要那个额外的步骤,我只希望它运行函数并忽略丢失的数据。

我也知道我可以在函数中指定忽略或不忽略,但我想要一种方法来选择忽略/不忽略,在逐个动作的基础上,而不是让它成为函数本身的一部分.

帮助表示赞赏。谢谢大家。

0 投票
1 回答
928 浏览

r - na.rm = ggplot2 的 geom_bar 处理的 T

我试图了解 ggplot2 的 geom_bar 如何处理 NA。帮助文件说:

na.rm:如果为 FALSE,则删除默认的缺失值并发出警告。如果为 TRUE,缺失值将被静默删除。

我正在尝试:

它在没有警告的情况下运行,并为每个因子级别以及 NA 生成计数。说得通。

现在,我不希望计算 NA。所以,我跑:

但是我仍然有图片中的NA。为什么?我错过了什么?

谢谢!

0 投票
1 回答
1879 浏览

r - R自定义函数应用于数据框中的所有变量

我正在尝试创建一个自定义函数,该函数将在循环中应用,为我提供一个表,其中包含我表中所有变量所需的所有信息。我的函数基于dplyr函数和base.

我的问题是base函数 ( names()) 要求 y 参数(变量名)用引号括起来,但是dplyr函数n_distinct需要简单地所以没有引号才能给出正确的答案na.rm=TRUE(如果我使用n_distinct(x[y], na.rm=TRUE)它不会给出我是没有 NA 值的结果)。所以我不知道如何找到一个解决方案来让y参数的良好形式传入两个函数。我已经尝试使用\"names()功能,但它似乎没有用。这里我得到的错误:

错误:Error in summarise_impl(.data, dots) : variable 'y' not found

错误:Error in summarise_impl(.data, dots) : Evaluation error: object 'cyl' not found.

没有错误,但na.rm=TRUE似乎没有看到。

然后,我的目标将是带有一些循环的苹果,为我的数据框的每个变量创建一个包含一行的表,然后我可以导出该表,以便在一个表中包含所有变量的这些信息。

我试图制作一个最小的可重现示例:

但是由于某些难以理解的原因(至少对我而言)它不起作用(行a <- lapply(colnames(mtcars), function(x) data.frame(bind_rows(a, myfun(mtcars, x)))),错误消息Error in summarise_impl(.data, dots) : Columnvar is of unsupported type NULL)。它适用于我的数据框,我对它进行了子集化,它仍然运行良好,我通过在同一个类中手动编写所有相同的值再次手动创建它,它没有工作......所以我真的迷路了,不明白为什么它适用于我的数据集,但没有其他,因为我是 R 的新手,只是通过尝试学习这一点,没有关于这种语言代码的讲座,我有时不知道我真正在做什么,但它工作(就像我上面的这段代码),然后就没有了......

所以这段代码对我来说效果很好,只是说问题是因为我使用n_distinct(x[, y])它忽略了na.rm=TRUE,我无法理解。

抱歉,我问了一个相当不全面的问题,如果您对如何澄清它发表评论,我会很高兴编辑它。我完全迷失了我的尝试,不知道如何以更清晰的方式呈现事物。感谢您的帮助,并为混乱感到抱歉