问题标签 [desctools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
575 浏览

r - 在 3.3.3 中安装 DescTools 会导致 RStudio 崩溃

我正在使用 R 3.3.3,因为它可以被 SPSS 25 读取。如果我尝试安装包“DescTools”,应用程序会自行关闭。CRAN 说“DescTools”适用于 R 3.3.0 及更高版本。有不同的包吗?如果是这样,我如何用一个有效的替换有故障的?

0 投票
1 回答
314 浏览

r - R 使用特定截止值进行 Winsorizing 不起作用

我想使用变量的平均值加(/减)2个标准差作为截止点来对我的数据进行winsorize。因此,我想一个一个地对每个变量进行winsorize。

我想在下面提供的示例代码中进行优化的变量有 5 个异常值。

我创建了两个基准(高和低)并将它们插入到 minval 和 maxval 中。只是为了防止误解:我的数据框中有几个时间点和组,grepl 部分是只在一个测量点获得一组用于winsorizing。

到目前为止我的代码:

我得到的错误是:

“错误$<-.data.frame( *tmp*, RRSout, value = c(1, 1.33333333333333, : 替换有 38 行,数据有 510”

我的替换只有 38 行,因为 ^34.* 组只有 38 名参与者。我必须对每组和测量点的异常值进行缩尾处理......

如何替换/优化 RRS 变量中特定参与者组的异常值?

非常感谢您!

0 投票
2 回答
64 浏览

r - 处理基于前 5 个值的制表符分隔文件并使用它打印相邻列值

我有一个制表符分隔的文件abc.txt

第 1 列-Contig 有多个重复值,第 2 列有分数,第 3 列有与第 2 列分数对应的引导字母。我需要为第一列(contig)中的相似值选择前 5 个分数,并在那里打印对应的第 3 列值。

输出应如下所示,第一列具有唯一的列 1-Contig 条目,接下来的 10 行用于前 5 个分数和相应的列 3 引导字母

我使用了“dplyr”和“desctools”包,但是运行时出现了一些错误。

并得到这个错误

我被要求在 excel 中使用“sumproduct、large、iferror 和 vllokup”公式执行此操作,但是对于大型数据集,我想使用 R 提取文件。

任何帮助都感激不尽

0 投票
1 回答
277 浏览

r - Winsorize 函数:`[.data.frame`(x, order(x, na.last = na.last, 递减 = 递减)) 中的错误:选择了未定义的列

我想对我的数据进行winsorize,如下所示(总共 134 个观察值):

为了使用包中的winsorize函数,我通过简单地使用函数DescTools创建了一个变量的单个数字向量:revselectrev_vector <- select(data1, -...)

然后我按以下方式运行该函数,这给了我一个错误:

这是因为我实现了data.frame而不是向量而引起的吗?或者,我尝试了以下方法:

我不确定结果意味着什么?由于我认为 winorize 在查看 vector: 的摘要时实际上并没有起作用summary(rev_vector$rev),因此它与之前的 winsorizing 没有变化。

有人可以帮我吗?谢谢!

0 投票
1 回答
322 浏览

python - 哪个winsorize更准确,Python还是R

我正在尝试实现一个winsorization函数,但对它的确切定义感到困惑。显然,R包中DescTool的 winsorize 函数和Python库中的 winsorize 函数会scipy.stats.mstats产生不同的结果。我对此感到有些惊讶,因为这两个功能都非常受欢迎,但似乎没有人关心其中的区别。这是一个简单的测试:

R

结果是[2.475, 2.475, 2.475, 3., 4., 5., 6., ..., 96., 96.525, 96.525, 96.525]

然而,在 Python 中,

结果是[2., 2., 2., 3., 4., 5., 6., ..., 96., 97., 97. ,97.]

更糟糕的是,根据维基百科的例子,应该是[3., 3., 3., 3., 4., 5., 6., ..., 96., 96., 96. ,96.]因为第 2.5 个百分位数是 2.475,它介于 2 和 3 之间,因此,小于 2.475 的所有值都应该舍入到 3。

有人知道我应该实施哪个版本吗?

谢谢

0 投票
1 回答
106 浏览

r - R函数确定两个日期间隔之间的重叠——DescTools间隔函数

我正在寻找一种方法来确定两个日期间隔之间的重叠(以天为单位)。我有列 startdate1、enddate1、startdate2、enddate2。我想要一个额外的列,其中包含间隔(startdate1,enddate1)和(startdate2,enddate2)之间的重叠天数。
例如,我想得到这样的结果:

我一直在尝试使用 DescTools 包中的 Interval 函数来实现这一点:

但我收到错误错误:

as.Date.numeric(c(df1$startdate1, df1$enddate1)) : 'origin' 必须提供"

我还研究了 lubridate 包——我使用了间隔函数(不同于上面的 DescTools 间隔)来创建列 interval1 和 interval2,但我不知道有一个函数可以计算它们之间的重叠天数。

任何帮助表示赞赏。提前致谢!

0 投票
1 回答
342 浏览

r - C 统计量和 AUC 不一致

我发现,当我使用 DescTools 的内置函数计算 C 统计量时,我得到的值与计算接收者操作特征曲线 (AUC) 下的面积时不同。对于逻辑回归,它应该是相同的。例如,考虑

任何人都可以解释为什么我计算的 C 统计量和 AUC 不同,以及我应该为我的 C 统计量使用哪种度量。谢谢!

0 投票
1 回答
42 浏览

r - 计算给定预期基尼指数的值向量

DescTools用来计算基尼指数,一种衡量不平等的方法,效果很好。但我似乎无法弄清楚如何使用它来计算倒数:我应该输入什么值才能使基尼指数相等。

数据

为了重现性,这是我正在使用的数据-

问题

我现在可以使用以下方法计算每种模式的基尼指数(作为衡量不平等的指标)DescTools

但是我还想计算相反的值:列中
的值应该是什么,share以便不观察到这种不等式(这意味着相同的基尼指数)。 请注意,我希望share_hr保持不变。

有没有办法使用DescTools包或任何其他包来做到这一点?

0 投票
0 回答
68 浏览

r - 分析矩阵的熵

给定两个矩阵MAT1MAT2其中包含一组三个元素(F,L,G)的不同坐标的向量列,我想测试这两个矩阵中哪个具有更高的熵。换句话说,对于同一个元素,每个向量的数据点有时彼此非常接近,而在其他情况下则彼此相距太远。当向量处于平衡状态时,一类(F、L 或 G)的点处于相同位置或几乎非常接近。

如果每个实验的向量列数可能不同,那么哪种方法是正确的测试方法?一些玩具数据:

我一直在使用 R 函数DescTools::MutInf(MAT1),但如您所见,我不是该领域的专家!

谢谢,

0 投票
0 回答
157 浏览

r - 来自两个包(irr、DescTools)的 Cohen 的 kappa 函数给出不同的结果

我正在尝试用 R 中的置信区间计算加权 kappa。

我无法理解为什么 DescTools::CohenKappa 和 irr::kappa2 这两个函数会给出不同的输出。我需要使用前者(DescTools::CohenKappa),因为我需要置信区间,但想知道为什么这些会产生不同的结果?

DescTools::CohenKappa:

irr::kappa2:

这是一个例子: