实际上,我正在研究住院患者住院期间的路径。这些路径表示为状态序列(每个时间单位的当前医疗单元),我试图通过聚类算法找到典型的路径。
seqdist
我通过使用R 包中的函数TraMineR
和方法来创建距离矩阵"OMspell"
。我已经阅读了 R 文档和相关文章,但我找不到如何设置参数tpow
和expcost
.
由于时间单位是一小时,我不希望任何微小的持续时间差异对聚类结果产生重大影响(例如,与医疗单位转移相反)。但我也不希望持续时间没有任何影响......
另外,是否有适当的方法来选择它们的值?还是我只是继续摸索一个好的配置?(我使用 Dunn、Davies-Bouldin 和 Silhouette 标准来比较层次聚类的结果,除了对结果聚类的医学意见)