问题标签 [desctools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在 3.3.3 中安装 DescTools 会导致 RStudio 崩溃
我正在使用 R 3.3.3,因为它可以被 SPSS 25 读取。如果我尝试安装包“DescTools”,应用程序会自行关闭。CRAN 说“DescTools”适用于 R 3.3.0 及更高版本。有不同的包吗?如果是这样,我如何用一个有效的替换有故障的?
r - R 使用特定截止值进行 Winsorizing 不起作用
我想使用变量的平均值加(/减)2个标准差作为截止点来对我的数据进行winsorize。因此,我想一个一个地对每个变量进行winsorize。
我想在下面提供的示例代码中进行优化的变量有 5 个异常值。
我创建了两个基准(高和低)并将它们插入到 minval 和 maxval 中。只是为了防止误解:我的数据框中有几个时间点和组,grepl 部分是只在一个测量点获得一组用于winsorizing。
到目前为止我的代码:
我得到的错误是:
“错误
$<-.data.frame
(*tmp*
, RRSout, value = c(1, 1.33333333333333, : 替换有 38 行,数据有 510”
我的替换只有 38 行,因为 ^34.* 组只有 38 名参与者。我必须对每组和测量点的异常值进行缩尾处理......
如何替换/优化 RRS 变量中特定参与者组的异常值?
非常感谢您!
r - 处理基于前 5 个值的制表符分隔文件并使用它打印相邻列值
我有一个制表符分隔的文件abc.txt
第 1 列-Contig 有多个重复值,第 2 列有分数,第 3 列有与第 2 列分数对应的引导字母。我需要为第一列(contig)中的相似值选择前 5 个分数,并在那里打印对应的第 3 列值。
输出应如下所示,第一列具有唯一的列 1-Contig 条目,接下来的 10 行用于前 5 个分数和相应的列 3 引导字母
我使用了“dplyr”和“desctools”包,但是运行时出现了一些错误。
并得到这个错误
我被要求在 excel 中使用“sumproduct、large、iferror 和 vllokup”公式执行此操作,但是对于大型数据集,我想使用 R 提取文件。
任何帮助都感激不尽
r - Winsorize 函数:`[.data.frame`(x, order(x, na.last = na.last, 递减 = 递减)) 中的错误:选择了未定义的列
我想对我的数据进行winsorize,如下所示(总共 134 个观察值):
为了使用包中的winsorize
函数,我通过简单地使用函数DescTools
创建了一个变量的单个数字向量:rev
select
rev_vector <- select(data1, -...)
然后我按以下方式运行该函数,这给了我一个错误:
这是因为我实现了data.frame
而不是向量而引起的吗?或者,我尝试了以下方法:
我不确定结果意味着什么?由于我认为 winorize 在查看 vector: 的摘要时实际上并没有起作用summary(rev_vector$rev)
,因此它与之前的 winsorizing 没有变化。
有人可以帮我吗?谢谢!
python - 哪个winsorize更准确,Python还是R
我正在尝试实现一个winsorization函数,但对它的确切定义感到困惑。显然,R
包中DescTool
的 winsorize 函数和Python
库中的 winsorize 函数会scipy.stats.mstats
产生不同的结果。我对此感到有些惊讶,因为这两个功能都非常受欢迎,但似乎没有人关心其中的区别。这是一个简单的测试:
在R
结果是[2.475, 2.475, 2.475, 3., 4., 5., 6., ..., 96., 96.525, 96.525, 96.525]
。
然而,在 Python 中,
结果是[2., 2., 2., 3., 4., 5., 6., ..., 96., 97., 97. ,97.]
。
更糟糕的是,根据维基百科的例子,应该是[3., 3., 3., 3., 4., 5., 6., ..., 96., 96., 96. ,96.]
因为第 2.5 个百分位数是 2.475,它介于 2 和 3 之间,因此,小于 2.475 的所有值都应该舍入到 3。
有人知道我应该实施哪个版本吗?
谢谢
r - R函数确定两个日期间隔之间的重叠——DescTools间隔函数
我正在寻找一种方法来确定两个日期间隔之间的重叠(以天为单位)。我有列 startdate1、enddate1、startdate2、enddate2。我想要一个额外的列,其中包含间隔(startdate1,enddate1)和(startdate2,enddate2)之间的重叠天数。
例如,我想得到这样的结果:
我一直在尝试使用 DescTools 包中的 Interval 函数来实现这一点:
但我收到错误错误:
as.Date.numeric(c(df1$startdate1, df1$enddate1)) : 'origin' 必须提供"
我还研究了 lubridate 包——我使用了间隔函数(不同于上面的 DescTools 间隔)来创建列 interval1 和 interval2,但我不知道有一个函数可以计算它们之间的重叠天数。
任何帮助表示赞赏。提前致谢!
r - C 统计量和 AUC 不一致
我发现,当我使用 DescTools 的内置函数计算 C 统计量时,我得到的值与计算接收者操作特征曲线 (AUC) 下的面积时不同。对于逻辑回归,它应该是相同的。例如,考虑
任何人都可以解释为什么我计算的 C 统计量和 AUC 不同,以及我应该为我的 C 统计量使用哪种度量。谢谢!
r - 计算给定预期基尼指数的值向量
我DescTools
用来计算基尼指数,一种衡量不平等的方法,效果很好。但我似乎无法弄清楚如何使用它来计算倒数:我应该输入什么值才能使基尼指数相等。
数据
为了重现性,这是我正在使用的数据-
问题
我现在可以使用以下方法计算每种模式的基尼指数(作为衡量不平等的指标)DescTools
:
但是我还想计算相反的值:列中
的值应该是什么,share
以便不观察到这种不等式(这意味着相同的基尼指数)。
请注意,我希望share_hr
保持不变。
有没有办法使用DescTools
包或任何其他包来做到这一点?
r - 分析矩阵的熵
给定两个矩阵MAT1
,MAT2
其中包含一组三个元素(F,L,G)的不同坐标的向量列,我想测试这两个矩阵中哪个具有更高的熵。换句话说,对于同一个元素,每个向量的数据点有时彼此非常接近,而在其他情况下则彼此相距太远。当向量处于平衡状态时,一类(F、L 或 G)的点处于相同位置或几乎非常接近。
如果每个实验的向量列数可能不同,那么哪种方法是正确的测试方法?一些玩具数据:
我一直在使用 R 函数DescTools::MutInf(MAT1)
,但如您所见,我不是该领域的专家!
谢谢,
r - 来自两个包(irr、DescTools)的 Cohen 的 kappa 函数给出不同的结果
我正在尝试用 R 中的置信区间计算加权 kappa。
我无法理解为什么 DescTools::CohenKappa 和 irr::kappa2 这两个函数会给出不同的输出。我需要使用前者(DescTools::CohenKappa),因为我需要置信区间,但想知道为什么这些会产生不同的结果?
DescTools::CohenKappa:
irr::kappa2:
这是一个例子: