问题标签 [summarytools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 当变量是没有 NA 的因素时,summarytools::freq 会给出意想不到的结果
由于我的数据已汇总计数,因此我正在使用 summmarytools 中带有权重的 freq 函数。
使用权重时,freq 函数可以很好地汇总列
- 该列是数字或整数
- 列是具有 NA 或 NaN 值的因子
但当
- 该列是没有 NA 或 NaN 值的因子,然后摘要从列中取出一个级别并将其显示在 NA 中!
我在一个现场案例中遇到了这个问题,并复制了一个样本。
频率是整数还是数字无关紧要
如果我们有一个没有 Nan 或 NA 值的因子,它会有所不同
dt$B
类型:数字
dt$C
类型:因子
dt$D
类型:因子
dt$E
类型:因子
r - 基本 R summary() 和 summarytools descr() 函数结果之间的奇怪差异
我有一个数字数据向量(下面的示例)。让我们将向量存储为 x。当我运行summary(x) 和descr(x) 时,descr() 来自summarytools 包,我对Min、Median、Mean 和Max 值达成一致。但是,我的第一和第三四分位数值不同。这是我第一次看到两个函数结果之间的这种差异。关于为什么以及如何发生这种情况的任何想法?
我开始探索 descr() 源代码,但还没有走多远,也无法访问 summary() 源以查看其中是否存在差异。但是,在查看一些累积百分比时,我认为它们计算分位数的方式可能有所不同。
使用descr() Q1= 298.20 和Q3= 847.70 使用summary() Q1= 313.6 和Q3= 834.5
当我运行 freq(x) 并查看累积百分比时,298.2 为 25.53%,821.4 为 74.47%,847.7 为 76.6%。所以看起来 descr() 可能会列出最接近但不低于第 1 和第 3 四分位数的 x 向量的值。
(821.4+847.7)/2 = 834.5
这与汇总的第三四分位数相匹配,这不是向量值,但更接近估计的累积 75%。仍然不确定 summary() 如何获得第一个四分位数的 313.6。
r - 如何从 R 中使用“freq”函数生成的表中排除累积和总比例?
我正在使用包中的freq
函数summarytools
在 RStudio 中创建频率表。
似乎无法关闭表格中的累积百分比和总百分比列。例如:
仍然会生成一个包含重复的累积和总百分比列的表。我只需要一个包含变量值、计数和百分比的表格。
我尝试使用重置全局选项st_options(freq.cumul = FALSE, freq.totals = FALSE)
但收到错误消息:
更新
终于弄明白了——我没有在freq
函数中使用足够的参数。以下代码生成了一个不错的频率表:
如果您需要跨多个列创建一堆表multiple_:
r - 有没有办法在 RStudio 查看器中显示多个表格?
ctable
如果我使用包中的函数运行以下交叉表代码summarytools
:
而不是在 RStudio 查看器中看到三个交叉表,只显示最后一个。如果我尝试显示所有三个表:
我收到以下错误消息:
有没有办法在同一个查看器窗口中堆叠所有三个表?也许一种组合交叉表的html输出文件的方法?
r - summarytools:如何编辑变量名称或在 dfSummary() 输出中添加文本?
我需要使用 总结数据集dfSummary()
,但我需要替换输出中的变量名称(无需再次重命名整个数据集)。另外,我需要在一些变量上写下注释(即哪些变量被颠倒等)
我还没有找到任何方法来做到这一点,也没有在文档或在线论坛中找到。谢谢!
r - 在 summarytools 中嵌套 ifelse
我正在帮助一位同事解决她的代码中的错误。我们希望在 4 个变量中获得具有有效值的单位的频率。她使用 ifelse 标记符合她的标准的单元,然后使用 summarytools::freq 来获取汇总频率表。嵌套代码(初始运行)生成以下错误:错误:长度(名称)== 1 is not TRUE
有人可以帮我理解这里发生了什么吗?
当 ifelse 被分离出来时,逐步的方法没有问题(标记为 b)。我还偶然发现在 ifelse 周围包含一组额外的括号消除了错误(标记为 c)
r - SummaryTools dfSummary() 不提供输出,仅提供 HTML
尝试在我的工作 PC (Windows) 上使用 SummaryTools。我正在尝试运行 dfSummary() 但我得到的唯一输出是控制台中的 HTML 代码。
我在我的个人 Mac 上使用这个库没有问题,所以我认为这可能与 R 的安装方式有关,但没有人帮助 IT 解决这个问题。
以前的相关主题有建议而不是 dfSummary(iris)
使用:
print(dfSummary(iris),method='render')
两种方法都不起作用
库(summarytools)dfSummary(iris)打印(dfSummary(iris),method='render')
实际输出应该包括漂亮的图形和表格。类似于在这里找到的内容:
https://cran.r-project.org/web/packages/summarytools/vignettes/Introduction.html
r - R试图在数据集的多个子集上运行dfsummary和freqs作为宏
Orange 是数据集包中默认安装的数据集,它是我拥有的最接近我的真实数据的数据集。我添加了一个带有空格的文本列,因为它表示我的真实数据中也有空格的列以及它需要作为子集的内容。而且我知道我可以复制并粘贴 dfsummary 和频率代码 13 次(我需要多少次),但我真的不想这样做。任何人都可以让它工作吗?我希望新的数据集是 Tree1、Tree2、Tree3、Tree4 和 Tree5,但是 paste() 函数不喜欢我写的内容,我想为每个子集获取一个 dfsummary 和 freqs(来自 summarytools)。
r - 将 dfSummary 导出到 Latex 中
我有一个由因子和数字组成的数据集,我想在我的乳胶中导出视图(dfSummary(mtcars)),这可能吗?提前谢谢了
这是行不通的xtable(dfSummary(mtcars))