问题标签 [desctools]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

54 问题

0 投票

2 回答

575 浏览

r - 在 3.3.3 中安装 DescTools 会导致 RStudio 崩溃

我正在使用 R 3.3.3，因为它可以被 SPSS 25 读取。如果我尝试安装包“DescTools”，应用程序会自行关闭。CRAN 说“DescTools”适用于 R 3.3.0 及更高版本。有不同的包吗？如果是这样，我如何用一个有效的替换有故障的？

2019-03-04T04:24:50.573

0 投票

1 回答

314 浏览

r - R 使用特定截止值进行 Winsorizing 不起作用

我想使用变量的平均值加（/减）2个标准差作为截止点来对我的数据进行winsorize。因此，我想一个一个地对每个变量进行winsorize。

我想在下面提供的示例代码中进行优化的变量有 5 个异常值。

我创建了两个基准（高和低）并将它们插入到 minval 和 maxval 中。只是为了防止误解：我的数据框中有几个时间点和组，grepl 部分是只在一个测量点获得一组用于winsorizing。

到目前为止我的代码：

我得到的错误是：

“错误$<-.data.frame( *tmp*, RRSout, value = c(1, 1.33333333333333, : 替换有 38 行，数据有 510”

我的替换只有 38 行，因为 ^34.* 组只有 38 名参与者。我必须对每组和测量点的异常值进行缩尾处理......

如何替换/优化 RRS 变量中特定参与者组的异常值？

非常感谢您！

r trim desctools

2019-05-20T20:13:27.547

0 投票

2 回答

64 浏览

r - 处理基于前 5 个值的制表符分隔文件并使用它打印相邻列值

我有一个制表符分隔的文件abc.txt

第 1 列-Contig 有多个重复值，第 2 列有分数，第 3 列有与第 2 列分数对应的引导字母。我需要为第一列（contig）中的相似值选择前 5 个分数，并在那里打印对应的第 3 列值。

输出应如下所示，第一列具有唯一的列 1-Contig 条目，接下来的 10 行用于前 5 个分数和相应的列 3 引导字母

我使用了“dplyr”和“desctools”包，但是运行时出现了一些错误。

并得到这个错误

我被要求在 excel 中使用“sumproduct、large、iferror 和 vllokup”公式执行此操作，但是对于大型数据集，我想使用 R 提取文件。

任何帮助都感激不尽

r dplyr desctools

2019-06-21T16:49:08.100

0 投票

1 回答

277 浏览

r - Winsorize 函数：`[.data.frame`(x, order(x, na.last = na.last, 递减 = 递减)) 中的错误：选择了未定义的列

我想对我的数据进行winsorize，如下所示（总共 134 个观察值）：

为了使用包中的winsorize函数，我通过简单地使用函数DescTools创建了一个变量的单个数字向量：revselectrev_vector <- select(data1, -...)

然后我按以下方式运行该函数，这给了我一个错误：

这是因为我实现了data.frame而不是向量而引起的吗？或者，我尝试了以下方法：

我不确定结果意味着什么？由于我认为 winorize 在查看 vector: 的摘要时实际上并没有起作用summary(rev_vector$rev)，因此它与之前的 winsorizing 没有变化。

有人可以帮我吗？谢谢！

r dataframe desctools

2019-10-30T20:18:03.700

0 投票

1 回答

322 浏览

python - 哪个winsorize更准确，Python还是R

我正在尝试实现一个winsorization函数，但对它的确切定义感到困惑。显然，R包中DescTool的 winsorize 函数和Python库中的 winsorize 函数会scipy.stats.mstats产生不同的结果。我对此感到有些惊讶，因为这两个功能都非常受欢迎，但似乎没有人关心其中的区别。这是一个简单的测试：

在R

结果是[2.475, 2.475, 2.475, 3., 4., 5., 6., ..., 96., 96.525, 96.525, 96.525]。

然而，在 Python 中，

结果是[2., 2., 2., 3., 4., 5., 6., ..., 96., 97., 97. ,97.]。

更糟糕的是，根据维基百科的例子，应该是[3., 3., 3., 3., 4., 5., 6., ..., 96., 96., 96. ,96.]因为第 2.5 个百分位数是 2.475，它介于 2 和 3 之间，因此，小于 2.475 的所有值都应该舍入到 3。

有人知道我应该实施哪个版本吗？

谢谢

python r scipy outliers desctools

2019-12-05T21:54:13.350

0 投票

1 回答

106 浏览

r - R函数确定两个日期间隔之间的重叠——DescTools间隔函数

我正在寻找一种方法来确定两个日期间隔之间的重叠（以天为单位）。我有列 startdate1、enddate1、startdate2、enddate2。我想要一个额外的列，其中包含间隔（startdate1，enddate1）和（startdate2，enddate2）之间的重叠天数。
例如，我想得到这样的结果：

我一直在尝试使用 DescTools 包中的 Interval 函数来实现这一点：

但我收到错误错误：

as.Date.numeric(c(df1$startdate1, df1$enddate1)) : 'origin' 必须提供"

我还研究了 lubridate 包——我使用了间隔函数（不同于上面的 DescTools 间隔）来创建列 interval1 和 interval2，但我不知道有一个函数可以计算它们之间的重叠天数。

任何帮助表示赞赏。提前致谢！

r intervals lubridate desctools

2020-04-22T21:42:50.903

0 投票

1 回答

342 浏览

r - C 统计量和 AUC 不一致

我发现，当我使用 DescTools 的内置函数计算 C 统计量时，我得到的值与计算接收者操作特征曲线 (AUC) 下的面积时不同。对于逻辑回归，它应该是相同的。例如，考虑

任何人都可以解释为什么我计算的 C 统计量和 AUC 不同，以及我应该为我的 C 统计量使用哪种度量。谢谢！

r logistic-regression desctools

2020-04-24T00:35:59.273

0 投票

1 回答

42 浏览

r - 计算给定预期基尼指数的值向量

我DescTools用来计算基尼指数，一种衡量不平等的方法，效果很好。但我似乎无法弄清楚如何使用它来计算倒数：我应该输入什么值才能使基尼指数相等。

数据

为了重现性，这是我正在使用的数据-

问题

我现在可以使用以下方法计算每种模式的基尼指数（作为衡量不平等的指标）DescTools：

但是我还想计算相反的值：列中
的值应该是什么，share以便不观察到这种不等式（这意味着相同的基尼指数）。 请注意，我希望share_hr保持不变。

有没有办法使用DescTools包或任何其他包来做到这一点？

r desctools

2020-04-26T11:15:41.907

0 投票

0 回答

68 浏览

r - 分析矩阵的熵

给定两个矩阵MAT1，MAT2其中包含一组三个元素（F，L，G）的不同坐标的向量列，我想测试这两个矩阵中哪个具有更高的熵。换句话说，对于同一个元素，每个向量的数据点有时彼此非常接近，而在其他情况下则彼此相距太远。当向量处于平衡状态时，一类（F、L 或 G）的点处于相同位置或几乎非常接近。

如果每个实验的向量列数可能不同，那么哪种方法是正确的测试方法？一些玩具数据：

我一直在使用 R 函数DescTools::MutInf(MAT1)，但如您所见，我不是该领域的专家！

谢谢，

r entropy desctools

2020-04-28T10:08:21.503

0 投票

0 回答

157 浏览

r - 来自两个包（irr、DescTools）的 Cohen 的 kappa 函数给出不同的结果

我正在尝试用 R 中的置信区间计算加权 kappa。

我无法理解为什么 DescTools::CohenKappa 和 irr::kappa2 这两个函数会给出不同的输出。我需要使用前者（DescTools::CohenKappa），因为我需要置信区间，但想知道为什么这些会产生不同的结果？

DescTools::CohenKappa:

irr::kappa2:

这是一个例子：

r statistics reliability desctools

2020-06-03T10:41:09.787

1 2 3 4 5 6 7 8 9 10

问题标签 [desctools]

数据

问题

Reference