1

实际上,我正在研究住院患者住院期间的路径。这些路径表示为状态序列(每个时间单位的当前医疗单元),我试图通过聚类算法找到典型的路径。

seqdist我通过使用R 包中的函数TraMineR和方法来创建距离矩阵"OMspell"。我已经阅读了 R 文档和相关文章,但我找不到如何设置参数tpowexpcost.

由于时间单位是一小时,我不希望任何微小的持续时间差异对聚类结果产生重大影响(例如,与医疗单位转移相反)。但我也不希望持续时间没有任何影响......

另外,是否有适当的方法来选择它们的值?还是我只是继续摸索一个好的配置?(我使用 Dunn、Davies-Bouldin 和 Silhouette 标准来比较层次聚类的结果,除了对结果聚类的医学意见)

4

1 回答 1

0

该参数tpow是一个指数系数,用于转换实际拼写长度(持续时间)。默认值为 1,其拼写长度按原样计算。使用tpow=0,您将忽略法术持续时间,而使用 ,tpow=0.5您将考虑法术长度的平方根。

expcost参数是扩展成本,即将(转换后的)法术长度扩展一个单位的成本。换句话说,当将一个序列编辑到另一个序列时,必须将长度的咒语t1扩展到长度t2,这将花费expcost * |t2^tpow - t1^tpow|. 对于expcost=0处于相同状态的咒语(例如 AA 和 AAAAA),无论它们的长度如何,它们都是等效的。

例如,将tpow=.5法术长度从 1 增加到 2 比将法术长度从 3 增加到 4 的成本更高。如果您不想太重视法术长度的微小差异,请使用低expcost. 但是,请注意,这expcost适用于转换后的拼写长度,您可能需要在更改tpow值时对其进行调整。

于 2018-12-17T17:13:08.123 回答