1

我正在从事以下项目,并正在探索 Hmisc 提供的 CurveRep() 聚类方法。(CurveRep 根据基于 CLARA 聚类算法的相似模式对个体受试者的纵向生长曲线进行聚类)。由于我没有找到任何使用 CurveRep() 的出版物,而且在互联网上通常很少讨论它,如果你能告诉我你的经验或你对它的看法,我将不胜感激!- 我的项目:我在三个时间点(0、30、120 分钟)在 n=500 名受试者中测量了大约 200 种代谢物。各个时间课程差异很大,但在意大利面条图中,似乎存在组(例如直线和平坦曲线、峰形曲线、谷形曲线)。我想将这些曲线聚类成两个或三个有代表性的时间课程,然后为每个聚类拟合一个特定于曲线的回归模型。CurveRep() 似乎正是我正在寻找的,它产生了可接受的集群解决方案(尽管解决方案更多地基于不同的 y 轴交叉点而不是不同的增长模式)。

有什么好处吗?是否有根据相似的纵向变化进行分组的替代聚类算法(例如,集群 1 =“线性上升”,集群 2 =“谷形”)?非常感谢!克里斯

4

1 回答 1

0

对于所有时间序列方法来说,三个时间点太少了,无法为您工作。看看 DTW - 它是为更高的分辨率而设计的。

k-means、PAM 和 CLARA 等聚类算法可以为您工作。查看集群中心。

可能需要更仔细地预处理您的数据。

如果您对变化而不是绝对值感兴趣,请相应地对数据进行编码。例如,

x1, x2, x3 -> x2-x1, x3-x2

或者

x1,x2,x3 -> x1-mu,x2-mu,x3-mu with mu=(x1+x2+x3)/3

这将使聚类结果更有可能与您的动机相匹配。

于 2015-04-13T06:18:26.410 回答