问题标签 [hmisc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将带有名称和标签的 .csv 文件读入 R
我有一个需要读入 R 的 .csv 文件。第一行包含名称(例如 BFI1、BFI2、CAQ2),第二行包含我也想在 R 中访问的问题(例如“我喜欢参加派对”)。前两个之后的每一行对应一个参与者。
我希望能够访问 R 中的代码和文本(例如,用于grep
访问一项调查中的所有问题,并在需要时查看项目文本。我需要数字响应为数字。
我想阅读此内容,以便可以访问名称(第 1 行)或文本(可能作为标签)。我看过Hmisc
包装,但它们的标签功能似乎有限。
有没有办法读取这个 .csv 文件并访问这两个值?
r - R中数据框的直方图颜色
在 R 中,hist.data.frame
(来自 Hmisc)为数据框中的每一列生成一个直方图,但我不知道如何更改条形的颜色。有什么办法可以做到这一点吗?
r - data.frames 上 R Hmisc 包列“标签”的替代方案
我处理大多数标题名称都是非常长的字符串的数据。这些是神秘的,但包含不能忘记的重要细节。由于各种显示原因以及编程原因,长列名称难以使用。为了解决这个问题,我通常将原始列名保留为 Hmisc 标签,并用 V1、V2、V3 等无信息名称重命名列,或者使用一些截断的(但仍然很长且通常不是唯一的)版本的长名称.
我现在可以使用短名称 V 并且仍然查找标签以获取原始名称。然而,这仍然不能令人满意...... myDF 现在由“labelled”类组成,并且包含字符向量,尽管我的数据本质上是数字的。转换为数字甚至子集 myDF 将导致标签被丢弃。有人有更好的建议吗?特别是我需要对数据进行子集化,并且我还发现按数字索引很笨拙且容易出错。
由于相对于 RAM 的大量数据,我无法同时保留数字和“标记”数据帧的副本。我还尝试使用 hash 包创建散列对象:
或通过列表:
但是......我也发现这些不令人满意,主要是因为它们在各种操作后可能与 myDF 不同步,并且无法从同一个对象访问它们。也许我只是需要更加勤奋。
最后,我认为也许一个解决方案是一个自定义类,它包含一个 data.frame 和一些其他数据结构,以了解非常无意义的简洁名称、冗长和非唯一的昵称以及真正的变量名称。但这需要重载所有索引运算符,并且可能超出我的技能范围。
那么还有其他有目的的解决方案吗?任何帮助表示赞赏。
r - 带有描述类的 psych 和 Hmisc 包
我在带有 R 3.1.1 的 Mac OS 10.10 上
我有以下数据框x
,我试图describe
从psych
包中获取其描述性统计信息(请注意,我现在已分离Hmisc
具有相同describe
功能的包)
这段代码给了我x_dex
有一个data.frame
类的对象。
如果我加载Hmisc
包,如果我使用与上面相同的代码,对象的类x_dex
将更改为。describe
由于我希望对象具有data.frame
能够将其写入 excel 文件的类,因此我尝试使用:
但它给出了以下错误:
需要知道为什么在加载Hmisc
包和任何适当的解决方案时会发生这种情况。
r - 使用 rcorr 的相关矩阵中的 p=0 是什么意思?
我一直在使用 R 中 Hmisc 包中的 rcorr 函数。我弄清楚了它是如何工作的,我可以提取结果,将它们放在一个漂亮的表中。我看了这篇文章:p-values of correlation coefficients。但是......剩下的一件事困扰着我:如果 p 值 = 0.0000 怎么办?即使您使用打印语句添加更多数字,p-value = 0。
这是否意味着它是一个非常显着的相关性?我的意思是,R 的计算能力是否已经达到极限,这就是为什么它只会返回“0”?
比如下面的一些结果。
当我用“test$P”进一步检查时,我会得到这个:
谢谢!
桑德
cluster-analysis - Hmisc 中的 CurveRep,用于基于 3 个时间点对纵向曲线进行聚类
我正在从事以下项目,并正在探索 Hmisc 提供的 CurveRep() 聚类方法。(CurveRep 根据基于 CLARA 聚类算法的相似模式对个体受试者的纵向生长曲线进行聚类)。由于我没有找到任何使用 CurveRep() 的出版物,而且在互联网上通常很少讨论它,如果你能告诉我你的经验或你对它的看法,我将不胜感激!- 我的项目:我在三个时间点(0、30、120 分钟)在 n=500 名受试者中测量了大约 200 种代谢物。各个时间课程差异很大,但在意大利面条图中,似乎存在组(例如直线和平坦曲线、峰形曲线、谷形曲线)。我想将这些曲线聚类成两个或三个有代表性的时间课程,然后为每个聚类拟合一个特定于曲线的回归模型。CurveRep() 似乎正是我正在寻找的,它产生了可接受的集群解决方案(尽管解决方案更多地基于不同的 y 轴交叉点而不是不同的增长模式)。
有什么好处吗?是否有根据相似的纵向变化进行分组的替代聚类算法(例如,集群 1 =“线性上升”,集群 2 =“谷形”)?非常感谢!克里斯
r - 创建函数来计算数据框子集的 rcorr
我目前使用 Hmisc 包手动创建大型 data.frame 的相关矩阵,如下所示:
我现在需要根据日历月期间(例如“2015-05”或“May-15”)计算每个变量在子集上的相关性。
日期目前是“每天”(例如 2015-05-29),所以我考虑包括一个新列“月份”,如下所示:
-@Andy Clifton 在另一个答案中建议
(尽管我需要将其格式化为“Mar-15”而不是“March”)
接下来有没有一种方法可以为每个月的子集自动创建每个新的 rcorr 矩阵变量(例如,mydatacorrelation002、mydatacorrelation003 等)?
非常感谢
r - loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) 中的错误:没有名为“stringi”的包
当我使用
我收到以下错误
同样,如果我使用
我收到以下错误
我尝试安装'stringi' install.packages("stringi")
但是在某些时候,在安装过程中,我收到以下错误消息:
我正在使用 RStudio(版本 0.99.447)并且我有 R 版本 3.2.1。
r - 如何用两个分类变量做一个交叉表,但用第三个变量的平均值填充它
这是我的交叉表
但不是得到计数,我想要平均价格(或平均值(价格)甚至最大值(价格)
我尝试了 Hmisc 包,但它为我提供了较长格式的数据,我需要它到上面的表格格式中
r - Hmisc乳胶功能需要删除第一行
我在 rmarkdown 文件中使用 Hmisc。当我创建一个表时,这就是我所做的
乳胶输出的第一行显示如下
注意'%'我需要弄清楚删除第一行,因为它在编织时显示在 PDF 文档上