“hmisc”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

4607 浏览

r - 将带有名称和标签的 .csv 文件读入 R

我有一个需要读入 R 的 .csv 文件。第一行包含名称（例如 BFI1、BFI2、CAQ2），第二行包含我也想在 R 中访问的问题（例如“我喜欢参加派对”）。前两个之后的每一行对应一个参与者。

我希望能够访问 R 中的代码和文本（例如，用于grep访问一项调查中的所有问题，并在需要时查看项目文本。我需要数字响应为数字。

我想阅读此内容，以便可以访问名称（第 1 行）或文本（可能作为标签）。我看过Hmisc包装，但它们的标签功能似乎有限。

有没有办法读取这个 .csv 文件并访问这两个值？

r labels read.table hmisc

2015-01-15T21:48:32.243

0 投票

1 回答

652 浏览

r - R中数据框的直方图颜色

在 R 中，hist.data.frame（来自 Hmisc）为数据框中的每一列生成一个直方图，但我不知道如何更改条形的颜色。有什么办法可以做到这一点吗？

r graphics histogram hmisc

2015-01-16T16:55:54.993

0 投票

1 回答

710 浏览

r - data.frames 上 R Hmisc 包列“标签”的替代方案

我处理大多数标题名称都是非常长的字符串的数据。这些是神秘的，但包含不能忘记的重要细节。由于各种显示原因以及编程原因，长列名称难以使用。为了解决这个问题，我通常将原始列名保留为 Hmisc 标签，并用 V1、V2、V3 等无信息名称重命名列，或者使用一些截断的（但仍然很长且通常不是唯一的）版本的长名称.

我现在可以使用短名称 V 并且仍然查找标签以获取原始名称。然而，这仍然不能令人满意...... myDF 现在由“labelled”类组成，并且包含字符向量，尽管我的数据本质上是数字的。转换为数字甚至子集 myDF 将导致标签被丢弃。有人有更好的建议吗？特别是我需要对数据进行子集化，并且我还发现按数字索引很笨拙且容易出错。

由于相对于 RAM 的大量数据，我无法同时保留数字和“标记”数据帧的副本。我还尝试使用 hash 包创建散列对象：

或通过列表：

但是......我也发现这些不令人满意，主要是因为它们在各种操作后可能与 myDF 不同步，并且无法从同一个对象访问它们。也许我只是需要更加勤奋。

最后，我认为也许一个解决方案是一个自定义类，它包含一个 data.frame 和一些其他数据结构，以了解非常无意义的简洁名称、冗长和非唯一的昵称以及真正的变量名称。但这需要重载所有索引运算符，并且可能超出我的技能范围。

那么还有其他有目的的解决方案吗？任何帮助表示赞赏。

r dataframe label hmisc

2015-03-03T18:01:57.437

0 投票

0 回答

1403 浏览

r - 带有描述类的 psych 和 Hmisc 包

我在带有 R 3.1.1 的 Mac OS 10.10 上

我有以下数据框x，我试图describe从psych包中获取其描述性统计信息（请注意，我现在已分离Hmisc具有相同describe功能的包）

这段代码给了我x_dex有一个data.frame类的对象。

如果我加载Hmisc包，如果我使用与上面相同的代码，对象的类x_dex将更改为。describe

由于我希望对象具有data.frame能够将其写入 excel 文件的类，因此我尝试使用：

但它给出了以下错误：

需要知道为什么在加载Hmisc包和任何适当的解决方案时会发生这种情况。

r dataframe psych hmisc describe

2015-03-11T12:02:13.147

0 投票

2 回答

5194 浏览

r - 使用 rcorr 的相关矩阵中的 p=0 是什么意思？

我一直在使用 R 中 Hmisc 包中的 rcorr 函数。我弄清楚了它是如何工作的，我可以提取结果，将它们放在一个漂亮的表中。我看了这篇文章：p-values of correlation coefficients。但是......剩下的一件事困扰着我：如果 p 值 = 0.0000 怎么办？即使您使用打印语句添加更多数字，p-value = 0。

这是否意味着它是一个非常显着的相关性？我的意思是，R 的计算能力是否已经达到极限，这就是为什么它只会返回“0”？

比如下面的一些结果。

当我用“test$P”进一步检查时，我会得到这个：

谢谢！

桑德

r correlation p-value hmisc

2015-03-24T10:53:16.863

0 投票

1 回答

211 浏览

cluster-analysis - Hmisc 中的 CurveRep，用于基于 3 个时间点对纵向曲线进行聚类

我正在从事以下项目，并正在探索 Hmisc 提供的 CurveRep() 聚类方法。（CurveRep 根据基于 CLARA 聚类算法的相似模式对个体受试者的纵向生长曲线进行聚类）。由于我没有找到任何使用 CurveRep() 的出版物，而且在互联网上通常很少讨论它，如果你能告诉我你的经验或你对它的看法，我将不胜感激！- 我的项目：我在三个时间点（0、30、120 分钟）在 n=500 名受试者中测量了大约 200 种代谢物。各个时间课程差异很大，但在意大利面条图中，似乎存在组（例如直线和平坦曲线、峰形曲线、谷形曲线）。我想将这些曲线聚类成两个或三个有代表性的时间课程，然后为每个聚类拟合一个特定于曲线的回归模型。CurveRep() 似乎正是我正在寻找的，它产生了可接受的集群解决方案（尽管解决方案更多地基于不同的 y 轴交叉点而不是不同的增长模式）。

有什么好处吗？是否有根据相似的纵向变化进行分组的替代聚类算法（例如，集群 1 =“线性上升”，集群 2 =“谷形”）？非常感谢！克里斯

cluster-analysis curve-fitting hmisc

2015-04-13T02:25:00.840

0 投票

1 回答

1284 浏览

r - 创建函数来计算数据框子集的 rcorr

我目前使用 Hmisc 包手动创建大型 data.frame 的相关矩阵，如下所示：

我现在需要根据日历月期间（例如“2015-05”或“May-15”）计算每个变量在子集上的相关性。

日期目前是“每天”（例如 2015-05-29），所以我考虑包括一个新列“月份”，如下所示：

-@Andy Clifton 在另一个答案中建议

（尽管我需要将其格式化为“Mar-15”而不是“March”）

接下来有没有一种方法可以为每个月的子集自动创建每个新的 rcorr 矩阵变量（例如，mydatacorrelation002、mydatacorrelation003 等）？

非常感谢

r hmisc

2015-05-29T18:00:49.803

0 投票

2 回答

74919 浏览

r - loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) 中的错误：没有名为“stringi”的包

当我使用

我收到以下错误

同样，如果我使用

我收到以下错误

我尝试安装'stringi' install.packages("stringi")

但是在某些时候，在安装过程中，我收到以下错误消息：

我正在使用 RStudio（版本 0.99.447）并且我有 R 版本 3.2.1。

r ggplot2 hmisc stringi

2015-06-22T14:48:03.927

0 投票

3 回答

2458 浏览

r - 如何用两个分类变量做一个交叉表，但用第三个变量的平均值填充它

这是我的交叉表

但不是得到计数，我想要平均价格（或平均值（价格）甚至最大值（价格）

我尝试了 Hmisc 包，但它为我提供了较长格式的数据，我需要它到上面的表格格式中

r crosstab hmisc

2015-06-28T13:52:49.780

0 投票

1 回答

456 浏览

r - Hmisc乳胶功能需要删除第一行

我在 rmarkdown 文件中使用 Hmisc。当我创建一个表时，这就是我所做的

乳胶输出的第一行显示如下

注意'%'我需要弄清楚删除第一行，因为它在编织时显示在 PDF 文档上

r latex hmisc

2015-07-16T00:20:51.143

问题标签 [hmisc]

Reference