我需要使用 总结数据集dfSummary()
,但我需要替换输出中的变量名称(无需再次重命名整个数据集)。另外,我需要在一些变量上写下注释(即哪些变量被颠倒等)
我还没有找到任何方法来做到这一点,也没有在文档或在线论坛中找到。谢谢!
我需要使用 总结数据集dfSummary()
,但我需要替换输出中的变量名称(无需再次重命名整个数据集)。另外,我需要在一些变量上写下注释(即哪些变量被颠倒等)
我还没有找到任何方法来做到这一点,也没有在文档或在线论坛中找到。谢谢!
没有简单的方法来替换变量名。最好重命名数据框本身的变量。有关注释,请参阅label()
函数。
编辑 1
您还可以使用footnote=
包print()
函数的参数(如果使用 html 结果)或caption=
ascii / markdown 结果的参数。
例子:
print(dfSummary(iris), caption="This is caption text")
view(dfSummary(iris), footnote="This is <em>footnote</em> text")
编辑 2
另外,请记住 dfSummary 生成数据帧。所以创建之后,可以简单的修改一下name列的内容:
dfs <- dfSummary(iris)
dfs$Variable
[1] "Sepal.Length\\\n[numeric]" "Sepal.Width\\\n[numeric]" "Petal.Length\\\n[numeric]"
[4] "Petal.Width\\\n[numeric]" "Species\\\n[factor]"
dfs$Variable <- <- sub("\\.", " ", dfs$Variable)
print(dfs, graph.col = FALSE, na.col = FALSE)
Data Frame Summary
iris
Dimensions: 150 x 5
Duplicates: 1
---------------------------------------------------------------------------
No Variable Stats / Values Freqs (% of Valid) Valid
---- -------------- ----------------------- -------------------- ----------
1 Sepal Length Mean (sd) : 5.8 (0.8) 35 distinct values 150
[numeric] min < med < max: (100.0%)
4.3 < 5.8 < 7.9
IQR (CV) : 1.3 (0.1)
2 Sepal Width Mean (sd) : 3.1 (0.4) 23 distinct values 150
[numeric] min < med < max: (100.0%)
2 < 3 < 4.4
IQR (CV) : 0.5 (0.1)
3 Petal Length Mean (sd) : 3.8 (1.8) 43 distinct values 150
[numeric] min < med < max: (100.0%)
1 < 4.3 < 6.9
IQR (CV) : 3.5 (0.5)
4 Petal Width Mean (sd) : 1.2 (0.8) 22 distinct values 150
[numeric] min < med < max: (100.0%)
0.1 < 1.3 < 2.5
IQR (CV) : 1.5 (0.6)
5 Species 1. setosa 50 (33.3%) 150
[factor] 2. versicolor 50 (33.3%) (100.0%)
3. virginica 50 (33.3%)
---------------------------------------------------------------------------