问题标签 [hmisc]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
4607 浏览

r - 将带有名称和标签的 .csv 文件读入 R

我有一个需要读入 R 的 .csv 文件。第一行包含名称(例如 BFI1、BFI2、CAQ2),第二行包含我也想在 R 中访问的问题(例如“我喜欢参加派对”)。前两个之后的每一行对应一个参与者。

我希望能够访问 R 中的代码和文本(例如,用于grep访问一项调查中的所有问题,并在需要时查看项目文本。我需要数字响应为数字。

我想阅读此内容,以便可以访问名称(第 1 行)或文本(可能作为标签)。我看过Hmisc包装,但它们的标签功能似乎有限。

有没有办法读取这个 .csv 文件并访问这两个值?

0 投票
1 回答
652 浏览

r - R中数据框的直方图颜色

在 R 中,hist.data.frame(来自 Hmisc)为数据框中的每一列生成一个直方图,但我不知道如何更改条形的颜色。有什么办法可以做到这一点吗?

0 投票
1 回答
710 浏览

r - data.frames 上 R Hmisc 包列“标签”的替代方案

我处理大多数标题名称都是非常长的字符串的数据。这些是神秘的,但包含不能忘记的重要细节。由于各种显示原因以及编程原因,长列名称难以使用。为了解决这个问题,我通常将原始列名保留为 Hmisc 标签,并用 V1、V2、V3 等无信息名称重命名列,或者使用一些截断的(但仍然很长且通常不是唯一的)版本的长名称.

我现在可以使用短名称 V 并且仍然查找标签以获取原始名称。然而,这仍然不能令人满意...... myDF 现在由“labelled”类组成,并且包含字符向量,尽管我的数据本质上是数字的。转换为数字甚至子集 myDF 将导致标签被丢弃。有人有更好的建议吗?特别是我需要对数据进行子集化,并且我还发现按数字索引很笨拙且容易出错。

由于相对于 RAM 的大量数据,我无法同时保留数字和“标记”数据帧的副本。我还尝试使用 hash 包创建散列对象:

或通过列表:

但是......我也发现这些不令人满意,主要是因为它们在各种操作后可能与 myDF 不同步,并且无法从同一个对象访问它们。也许我只是需要更加勤奋。

最后,我认为也许一个解决方案是一个自定义类,它包含一个 data.frame 和一些其他数据结构,以了解非常无意义的简洁名称、冗长和非唯一的昵称以及真正的变量名称。但这需要重载所有索引运算符,并且可能超出我的技能范围。

那么还有其他有目的的解决方案吗?任何帮助表示赞赏。

0 投票
0 回答
1403 浏览

r - 带有描述类的 psych 和 Hmisc 包

我在带有 R 3.1.1 的 Mac OS 10.10 上

我有以下数据框x,我试图describepsych包中获取其描述性统计信息(请注意,我现在已分离Hmisc具有相同describe功能的包)

这段代码给了我x_dex有一个data.frame类的对象。

如果我加载Hmisc包,如果我使用与上面相同的代码,对象的类x_dex将更改为。describe

由于我希望对象具有data.frame能够将其写入 excel 文件的类,因此我尝试使用:

但它给出了以下错误:

需要知道为什么在加载Hmisc包和任何适当的解决方案时会发生这种情况。

0 投票
2 回答
5194 浏览

r - 使用 rcorr 的相关矩阵中的 p=0 是什么意思?

我一直在使用 R 中 Hmisc 包中的 rcorr 函数。我弄清楚了它是如何工作的,我可以提取结果,将它们放在一个漂亮的表中。我看了这篇文章:p-values of correlation coefficients。但是......剩下的一件事困扰着我:如果 p 值 = 0.0000 怎么办?即使您使用打印语句添加更多数字,p-value = 0。

这是否意味着它是一个非常显着的相关性?我的意思是,R 的计算能力是否已经达到极限,这就是为什么它只会返回“0”?

比如下面的一些结果。

当我用“test$P”进一步检查时,我会得到这个:

谢谢!

桑德

0 投票
1 回答
211 浏览

cluster-analysis - Hmisc 中的 CurveRep,用于基于 3 个时间点对纵向曲线进行聚类

我正在从事以下项目,并正在探索 Hmisc 提供的 CurveRep() 聚类方法。(CurveRep 根据基于 CLARA 聚类算法的相似模式对个体受试者的纵向生长曲线进行聚类)。由于我没有找到任何使用 CurveRep() 的出版物,而且在互联网上通常很少讨论它,如果你能告诉我你的经验或你对它的看法,我将不胜感激!- 我的项目:我在三个时间点(0、30、120 分钟)在 n=500 名受试者中测量了大约 200 种代谢物。各个时间课程差异很大,但在意大利面条图中,似乎存在组(例如直线和平坦曲线、峰形曲线、谷形曲线)。我想将这些曲线聚类成两个或三个有代表性的时间课程,然后为每个聚类拟合一个特定于曲线的回归模型。CurveRep() 似乎正是我正在寻找的,它产生了可接受的集群解决方案(尽管解决方案更多地基于不同的 y 轴交叉点而不是不同的增长模式)。

有什么好处吗?是否有根据相似的纵向变化进行分组的替代聚类算法(例如,集群 1 =“线性上升”,集群 2 =“谷形”)?非常感谢!克里斯

0 投票
1 回答
1284 浏览

r - 创建函数来计算数据框子集的 rcorr

我目前使用 Hmisc 包手动创建大型 data.frame 的相关矩阵,如下所示:

我现在需要根据日历月期间(例如“2015-05”或“May-15”)计算每个变量在子集上的相关性。

日期目前是“每天”(例如 2015-05-29),所以我考虑包括一个新列“月份”,如下所示:

-@Andy Clifton 在另一个答案中建议

(尽管我需要将其格式化为“Mar-15”而不是“March”)

接下来有没有一种方法可以为每个月的子集自动创建每个新的 rcorr 矩阵变量(例如,mydatacorrelation002、mydatacorrelation003 等)?

非常感谢

0 投票
2 回答
74919 浏览

r - loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) 中的错误:没有名为“stringi”的包

当我使用

我收到以下错误

同样,如果我使用

我收到以下错误

我尝试安装'stringi' install.packages("stringi")

但是在某些时候,在安装过程中,我收到以下错误消息:

我正在使用 RStudio(版本 0.99.447)并且我有 R 版本 3.2.1。

0 投票
3 回答
2458 浏览

r - 如何用两个分类变量做一个交叉表,但用第三个变量的平均值填充它

这是我的交叉表

但不是得到计数,我想要平均价格(或平均值(价格)甚至最大值(价格)

我尝试了 Hmisc 包,但它为我提供了较长格式的数据,我需要它到上面的表格格式中

0 投票
1 回答
456 浏览

r - Hmisc乳胶功能需要删除第一行

我在 rmarkdown 文件中使用 Hmisc。当我创建一个表时,这就是我所做的

乳胶输出的第一行显示如下

注意'%'我需要弄清楚删除第一行,因为它在编织时显示在 PDF 文档上